Introducción al álgebra lineal 5ta edición - Howard Anton

Anuncio
INTRODUCCI~N
AL ALGEBRA
LINEAL
V E R S I ó N AUTORIZADA EN ESPAÑOL DE LA OBRA
PUBLICADA EN INGLÉS CON EL TíTULO:
ELEMENTARY LINEAR ALGEBRA
O JOHN
WILEY& SONS,INC.
COLABORADOR
EN LA T R A D U C C I ~ N :
HUGO VILLAG~MEZVELÁZQUEZ
LAPRESENTACI~NY DISPOSICI~N EN CONJUNTO DE
INTRODUCCIóN AL ALGEBRA LINEAL
SON PROPIEDAD DEL EDITOR. NINGUNA
PARTE DE ESTA OBRA
PUEDE SER REPRODUCIDA o TRANSMITIDA, MEDIANTE NINGUN
SISTEMA O MÉTODO, ELECTR6NICOOMECÁNlCO (INCLUYENDO
EL FOTOCOPIADO, LA GRABACIóN O CUALQUIERSISTEMA DE
R E C U P E R A C I ~ NY ALMACENAMIENTO DE INFORMACI~N),SIN
CONSENTIMIENTOPOR ESCRITO DEL EDITOR.
DERECHOS
RESERVADOS:
O 2001, EDITORIAL LIMUSA, S.A.DE C.V.
GRUPO NORIEGA EDITORES
BALDERAS
95, M É x l c o , D.F.
C.P. 06040
'-S$. (5)521 -21 -05
+
O1(800) 7-06-91-00
(5) 512-29-03
limusa@noriega.com.mx
www.noriega.com.mx
CANIEM NÚM. 121
,.
\.; ,.
.T
r
-
-?
I
i.
r
-
1
+
;
y! ;o!?
t4 ;S1
QUINTAREIMPRESI~N
DE LA SEGUNDA EDICIÓN
HECHO
EN M É x l c o
ISBN 968-1 8-5192-7
y Lauren
I
PROLOG0
Así comoenlaedición
anterior. enestanuevaediciónse
proporciona un tratamiento básico del álgebra lineal, idóneo para estudiantes que están cursando el
primer o segundo años de facultad. Mi objetivo es presentar los fundamentos del
álgebra lineal de la forma más clara posible. por lo que el aspecto pedagógico es
esencial. No se requiere haber estudiado cálculo, aunque se presentan ejercicios y ejemplos para estudiantes que tienen los conocimientos necesarios; estos
ejercicios y ejemplos están claramente indicados y se pueden omitir sin pérdida de continuidad.
RESUMEN DE LOS CAMBIOS EN ESTA EDICIóN
Aunque esta edición tiene mucho en común con la edición anterior, se trata de una
revisión sustancial. g e intentado mantener la claridad y el estilo de la edición
previa, y a la vez reflejar las necesidades cambiantes de una nueva generación de
estudiantes. Con esta intención hepuesto en práctica varias recomendaciones
hechas por el Linear Algebra Curriculum Study Group. También he hecho algunos cambios de organización que deben facilitar a los instructores cubrir los fundamentos detodos los temas esenciales, inclusive con severas restricciones de
tiempo. Posteriormente, en este prólogo se presenta una descripción de los cambios capítulo a capítulo, aunque a continuación se presenta unresumende los
cambios más importantes:
Mayor énfasis en las relaciones que hay entre los conceptos: Uno de los
objetivos importantes de un curso de álgebra lineal es establecer la trama
7
intrincada de las relaciones que hay entre sistemas de ecuaciones, matrices,
determinantes, veclores. transformaciones lineales y eigenvalores. En esta
edición. la trama de relaciones se desarrolla a través del siguiente
crescendo de teoremas que vinculan cada nueva idea con ideas precedentes:
1.5.3, 1.6.4. 2.3.6, 4.3.4, 63.9. 6.2.7, 6.4.5 y 7.1.5. Estos teoremas no sólo
hacen más coherente el panorama algebraico, sino también sirven como
fuente constante de repaso.
Transición m b suavehacialaabstracción:La
transición de R" a espacios vecloriales generales es traumática para casi todos los estudiantes.
de modo que he intentado suavizarla analizando Rn en detalle, recalcando
los conceptos geométricos subyacentes antes de proceder con el estudio de
espacios vectoriales generales.
Exposición temprana de transformaciones lineales y eigenvalores: A fin
de asegurar que el material sobre transformaciones lineales y eigenvalores
no se pierda al final delcurso, algunos de los conceptos básicos que se relacionan con tales temas se desarrollan más pronto en el texto y luego se
repasan cuando el tcma se desarrolla con mayor profundidad en la parte
final del texto. Por ejemplo, las ecuaciones características se analizan
brevemente en la sección sobre determinantes. Las transformacioncs lineales de H" a R'" se abordan inmediatamente después que se introduce K". y
se analizan más tarde enel contexto de las transformaciones linealcs
gencrales. Estos repasos ayudan a asegurar que los estudiantes se ramiliaricencon los fundanlentos de todoslos temas más importantes, inclusive
cuando el tiempo apremia.
Mayor énfasis en la conceptualización: Para mantener el interés actual
cn la conceptualización y en las aplicaciones crecientes del álgebra lineal a
las gráficas, he puesto mayor énfasis en los aspectos geométricos de las
rotaciones. proyecciones y reflexiones en
y en R3.
Nuevo material sobre mínimos cuadrados y descomposición QR: Seha
añadido nuevo material sobre mínimos cuadrados y descomposición QH,en
respuesta al interés creciente en estos temas.
Másdemostraciones: Se han añadidovarias demostraciones que antes
habían sido omitidas. Todas las demostraciones eneltexto
han sido
escritas en un estilo adecuado para principiantes. y se ha puesto especial
cuidado a fin de asegurar que el carácter accesible y amable del texto no
haya sido afectado de manera adversa por las demostraciones adicionales.
Quienes deseenun curso matemáticamente más forrnal encontrarán que
esta nueva edición es más idónea para tal efecto. y quienes deseen un curso
más conceptual tendrhn mayor elección en las demostraciones.
DETALLES DE LOS CAMBIOS DE ESTA EDICIÓN
La amplia aceptación de la edición anterior ha sido muy gratificante. y aprecio las sugerencias constructivas recibidas de parte de los usuarios y revisores. Se
han revisado algunas secciones del testo para presentarlas con más claridad, y se han
erectuando cambios sustanciales ente1 contenido y su OrgallhCiÓn, en rcspuesta a
las sugerencias tanto de los usuarios como de los revisores. así como de las cCOmendaciones hechas por el Linear Algebra ('urriculum Study (;roup.
Hay muchas formas en las que es posible ordenar el material en un curso de
algebra lineal:el ordenamiento que he elegido para 10s capítulos refleja m i inclinación por el axioma de que es necesarioproceder de 10 conocido 21 10 desconocido y de lo concreto a lo abstracto.
A continuación se presenta un resumen capítulo a capítulo de 10s cambios
más importantes en esta nueva edición.
Capítulo 1. Se presenta una nueva sección sobre matrices de forma espccial: diagonal, triangular y simétrica. Al modificar ligeramente el material.
no se incrementó el número de secciones de este capítulo.
Capítulo 2. A este capítulo determinante se ha añadido nuevomaterial
introductorio sobreeigenvalores,eigenvectores y ccuaciones características. Este material se repasa y posteriormente se analiza con más detalle en
el capítulo 7. Se ha añadido la demostración de la igualdad det(AR) =
det(A)det(B).
Capítulo 3. Se presenta nueva información sobre ecuaciones vectorialcs
de rectas y planos, y la interpretación geomktrica de los determinantes 2 x
2 ~ 3 x 3 .
Capítulo 4. Este es unnuevo capítulo dedicado exclusivamente a R". Se
desarrollan conceptos fündamentales y se presenta una introducción a las
transformaciones lineales de Rn a R"'. recalcando el aspecto geométrico dc
las proyecciones,rotaciones
y reflexiones. A diferencia de la edición
anterior, este material se presenta ahora antes del desarrollo de los espacios
vectoriales generales. El material de este capítulo se analiza más tarde, en
el contesto de espacios \,ectoriales generales.
Capítulo S. Este capítulo corresponde al capítulo 4 de l a edición anterior.
Se han añadido muchas de las demostraciones que se habían omitido. También se presenta nuevo material sobre el wronskiano, para quienes han cstudiado Cálculo, y se incluye nuevo material sobre los cuatro espacios fundamentales de unamatriz.
Capítulo 6. Este capítulo corresponde al capítulo 5 de la edición anterior.
Se presenta nuevo material sobre complementos ortogonalcs. descomposición QR y mínimos cuadrados.
Capítulo 7. Este capítulo corresponde al capítulo 6 de la edición anterior.
Se ha repasado el material desarrollado antes sobre eigenvalores y elgenvectores. Se incluye nuevo material sobre las multiplicidades geométrica y
algebraica. así como una explicación mejorada sobre los requisitos para la
diagonalización.
Capítulo 8. Este capítulo correspondeal capítulo 7 de l a edición anterior. El material se ha vuelto a escribir sustancialmente. a fin de reflejar
el hecho de que las transformaciones lineales de Rn a Hm se introdujeron en el capítulo 4.
Capítulo 9. Este capítulo corresponde al capítulo 8 y a las secciones 9. I y
9.2 de la edición anterior. Se ha vuelto a escribir la secciónsobre la
10
Prólogo
geometría de los operadores lineales sobre R2 para poder fundamentar los
conceptos desarrollados en la sección 4.2.
Capítulo 10. Este capítulo corresponde al capítulo 7 de la edición anterior.
Los cambios son menores.
ACERCA DE LOS EJERCICIOS
En todos los ejercicios de cada sección se empieza con problemas de rutina, se
avanza hacia problemasmás sustanciales y se concluye con problemasteóricos. AI
final de casi todos los capítulos se presenta un conjunto de ejercicios complementarios que pueden presentar más dificultad y forzar al estudiante a extraer ideas de
todo un capítulo, en vez de hacerlo solamente de unasección específica.
GUÍA PARA
EL INSTRUCTOR
PROGRAMAS POSIBLESPARA UN CURSO NORMAL
He revisado una gran cantidad de posibilidades para cursos de álgebra lineal. La
variación entre las instituciones es amplia, aunque los cursos tienden a caer en dos
categorías: una que consta de entre 20 y 30 lecciones (excluyendo los exámenes y
los repasos) y otra que consta de entre 35 y 40 lecciones (excluyendo los exámenes
y los repasos). Con base en mi análisis de estas posibilidades. he proporcionado
dos patrones para elaborar un curso propio. Los patrones se deben ajustar a fin de
reflejar los intereses y requisitos propios, aunque deben ser útiles como punto
de partida. En el patrón largo se supone que se cubren todas las seccionesdel
capítulo, y en el patrón corto se supone que el instructor selecciona material para
ajustarse al tiempo disponible.
Dos cambios en la organización del texto facilitan la construcción de cursos
más cortos: la breve introducción a los eigenvalores y eigenvectores que se presenta en las secciones 2.3 y 4.3 y la colocaciónprevia de las transformaciones
lineales de R" a Rm en el capítulo 4. Estos cambios aseguran que el estudiante se
familiarice unpococon
estos conceptos fundamentales, inclusive si el tiempo
disponible para abordar los capítulos 7 y S es limitado. Observé también que los
estudiantes que ya conocen el material pueden omitir el capítulo 3 sin pérdida de
continuidad.
12
Guía para el instructor
Patrón largo
Patrón corto
Capítulo 1
Capítulo 2
Capítulo 4
Capítulo S
Capítulo 6
Capítulo 7
Capítulo 8
7 lecciones
4 lecciones
3 lecciones
X lecciones
6 lecciones
3 lecciones
3 lecciones
7 lecciones
6 lecciones
3
3
Total
3 8 lecciones
4 lecciones
6 lecciones
lecciones
lecciones
2 lecciones
27 lecciones
VARIANTES DEL CURSO NORMAL
Son posibles muchas variantes del curso normal. Por ejemplo. es posible crcar un
patrón largo opcional siguiendo la asignación de tiempo del patrón corto y
dedicando las 11 lecciones restantes a algunos dc los temas de los cdphlOS 9 y 1 0 .
CURSO ORIENTADO A APLICACIONES
El capítulo 9 contiene aplicaciones selectas de álgebra lineal que son esencialmente de naturaleza matemática.Los instructores interesados en una variedad más
amplia de aplicaciones pueden considerar la otra versión de este texto, Elementary
Linear Algebra, Aplications Version. de Howard Anton y Chris Rorres. En esc
texto se proporcionan numerosas aplicaciones a los negocios. biología, ingeniería.
economía. ciencias sociales y ciencias físicas.
I
t
AGRADECIMIENTOS
1
Expreso mi aprecio por la útil orientación proporcionada por las siguientes personas:
REVISORES Y COLABORADORES DE EDICIONES ANTERIORES EN INGLÉS
Steven C. Althoen, University of Michigan-Flint
C. S. Ballantine, Oregon State University
Erol Barbut, University of Idaho
William A. Brown, University of Maine
Joseph Buckley, Western Michigan University
Thomas Cairns, University of Tulsa
Douglas E. Cameron, University of Akron
Bomshik Chang, University of British Columbia
Peter Colwell, Iowa State University
Carolyn A. Dean, University of Michigan
Ken Dunn, Dalhousie University
Bruce Edwards, University of Florida
Murray Eisenberg, University of Massachusetts
Harold S. Engelsohn, Kingshorough Comm. College
Garret Etgen, University ofHouston
Marjorie E. Fitting, San Jose State University
Dan Flath, University of South Alabama
David E. Flesner, Gettysburg College
Mathew Gould, Vanderbilt University
Ralph P. Grimaldi, Rose-Hulman Institute
William W. Hager, University of Florida
Collin J. Hightower, University of Colorado
Joseph F. Johnson, Rutgers University
Robert L. Kelley, University of Miami
Arlene Kleinstein
Myren Krom, Calfornia State University
Lawrence D. Kugler, University of Michigan
Charles Livingston, Indiana University
Nicholas Macri, Temple University
Roger H. Marty, Cleveland State University
Patricia T. McAuley, SUNY-Binghamton
Robert M. McConnel, University of Tennessee
Douglas McLeod, Drexel University
Michael R. Meck, Southern Connecticut State Univ.
Craig Miller, University of Pennsylvania
Donald P. Minassian, Butler University
Hal G. Moore, Brigham Young University
Thomas E. Moore, Bridgewater State College
Robert W. Negus, Rio Hondo Junior College
Bart S. Ng, Purdue University
13
I-í
I
Agradec.citrrientos
James Osterburg, University of Cincinnati
MichaelA.Penna,
Indiana-Purdue University
Gerald J.Porter, University of Pennsylvania
F. P. J. Rimrott, University qf Toronto
C. Ray
Rosentrater,
Westmont College
KennethSchilling, University of Michigan-Flint
William Scott, University of Utah
Donald R. Sherbert, University of Illinois
Bruce Solomon, Indiana University
Mary T. Treanor, Valparaiso University
William
Trench,
F.
Trinity University
Joseph L. Ullman, University of Michigan
W. VanceUnderhill, East Texas State University
James R. Wall, Auburn University
Arthur G. Wasserrnan, University of Michigan
Evelyn J. Weinstock, Glassboro State College
Rugang
Ye,
Stanford University
Frank
Zorzitto,
University of Waterloo
Daniel Zwick, University of Vermont
REVISORES Y COLABORADORES DE LA SÉPTIMA EDICIÓN EN INGLÉS,
SEGUNDA EN ESPAÑOL
Mark B. Beintema, Southern Illinois University
Paul Wayne Britt, Louisiana State University
David C. Buchthal, University of Akron
Keith Chavey, University of Wisconsin-River Falls
Stephen L. Davis, Davidson College
Blake DeSesa, Drexel University
Dan Flath, Uniwrsity of South Alabama
Peter Fowler, California State University
Marc Frantz, Indiatza-Purdue University
Sue Friedman, Bernard M. Baruch College, CUNY
William Golightly, College qf Charleston
Hugh Haynsworth, College qf Charleston
Tom Hem, Bow!ling Green State University
J. Hershenov, Queens College. CUNY
Steve Humphries, Brigham Young Universitt3
Steven Kahan, Queens College, CUNY
Andrew S. Kim, Westfield State College
John C. Lawlor, University of Vermont
M. Malek, California State University at Huyward
J. J. Malone, Worcester Polytechnic Institute
William McWorter, Ohio State University
Valerie A. Miller, Georgia State University
Hal G. Moore, Brigham Young University
S. Obaid, San Jose State University
Ira J. Papick, University of Missouri-Columbia
Donald Passman, University of Wisconsin
Robby Robson, Oregon State University
David Ryeburn, Simon Fraser University
Ramesh Sharma, University of New Haven
David A. Sibley, Pennsylvania State University
Donald Story, Universio,of Akron
Michael Tarabek, Southern Illinois University
SOLUCIONES A LOS PROBLEMAS, LECTURA DE PRUEBASE INDICE
Michael Dagg, Numerical Solutions, Inc.
Susan L. Friedman, Bernard M. Baruch College, CUNY
Mareen Kelley, Northern Essex Communih. College
Randy Schwartz, Schoolcraft College
Daniel Traster (Student), Yale Universio.
COMPLEMENTOS
Benny Evans, Oklahoma State University
Charles A. Grobe, Jr., Bowdoin College
Agradecimientos / 15
Elizabeth M. Grobe
IntelliPro, Inc.
Jerry Johnson, Oklahoma State University
Randy Schwartz, Schoolcraft College
OTROS COLABORADORES
Un agradecimiento especial a los siguientes profesores, quienes leyeron
profundamente el material del texto e hicieron contribuciones significativas a la
calidad del nivel matemático y de exposición:
Stephen Davis, Davidson College
Blaise DeSesa, Drexel University
Dan Flath, University of South Alabama
Marc Frantz, Indiana-Purdue University
William McWorter, Ohio State University
Donald Passman, University of Wisconsin
David Ryeburn, Simon Fraser University
Lois Craig Stagg, University of Wisconsin-Milwaukee
También deseo expresar mi agradecimiento a:
Barbara Holland, mi editora, quien me ayudó a moldear al concepto de esta
nueva edición y cuyo entusiasmo incluso convirtió en divertido el arduo trabajo (alguna vez).
Ann Berlin, Lucille Buonocore y Nancy Prinz del Departamenro de Producción de Wiley, por preocuparse tanto por la calidad de este trabajo y proporcionarme un apoyo extraordinario.
Lilian Brady, cuyoojo para los detalles y sentido estético infalible mejoró
grandemente la exactitud del texto y la belleza de la tipografía.
Joan Carafiello y Sharon Prendergagst por su soberbio trabajo en la coordinación de la miríada de detalles que mágicamente produjeron las respuestas y
los complementos a tiempo.
El grupo en Hudson River Studio por tratar con tanto tacto a un autor riguroso.
Mildred Jaggard, mi asistente, quien coordinó todoslos detalles deltexto
desde la lectura de pruebas hasta el índice con pericia consumada, y quien pacientemente toleró mi idiosincrasia.
HOWARD
ANTON
CAPíTULO 1
SISTEMAS DEECUACIONESLINEALES Y MATRICES
l . l . Introducción a los sistemas de ecuaciones lineales 2 1
1.2.Eliminacióngaussiana
29
1.3. Matrices y operaciones con matrices 47
1.4. Inversas: Reglas de la aritmética de matrices 61
1.5. Matrices elementales y unmétodo para determinarn"
75
1.6. Otros resultados sobre sistemas de ecuaciones e invertibilidad
1.7. Matrices diagonales, triangulares y simétricas 94
CAPíTULO 2
DETERMINANTES
85
107
2.1. La funcióndeterminante
107
2.2. Evaluación de determinantes por reducción de renglones
2.3. Propiedades de la funcióndeterminante121
2.4. Desarrollo por cofactores; Regla de Cramer 131
CAPíTULO 3
21
115
VECTORES EN LOS ESPACIOS BlDlMENSlONALY
TRIDIMENSIONAL. 149
3. l. Introducción a losvectores (geométrica) 147
3.2. Normade un vector; Aritmética vectorial159
3.3. Producto punto: Proyecciones165
17
3.4. Producto cruz 175
3.5. Rectas y planos en elespacio tridimensional
CAPITULO 4
ESPACIOS
VECTORIALES
189
EUCLIDIANOS
203
4. l . Espacio euclidiano n dimensional 203
4.2. Transformaciones lineales de R" a Rm 218
5.3. Propiedades de las transformaciones lineales de R" a Rm
CAPíTULO 5
ESPACIOS VECTORIALES
GENERALES
5. 1. Espaciosvectorialesreales257
5.2. Subespacios
265
5.3. Independencialineal277
5.4. Base y dimensión 287
5.5. Espacio renglón. espacio columna
5.6. Rango y nulidad322
CAPíTULO 6
239
257
y espacio nulo 306
ESPACIOS CON PRODUCTO INTERIOR
339
6.1. Productos interiores
339
6.2. Ángulo y ortogonalidad en espacios con producto interior 353
6.3. Bases ortonormales: Proceso de Gram-Schmidt; Descomposición QR
3 67
6.4. Mejoraproximación: Mínimos cuadrados 384
6.5. Matricesortogonales:Cambio de base395
CAPíTULO 7
EIGENVALORES,
EIGENVECTORES
41
7. l. Eigenvalores y eigenvectores
7.2. Diagonalización 426
7.3. Diagonalización ortogonal437
CAPíTULO 8
5
4 15
TRANSFORMACIONES LINEALES
447
8. I , Transformaciones lineales generales 447
8.2. Núcleo y recorrido461
8.3, Transformaciones lineales inversas 468
8.4. Matrices de transformacioneslineales generales
8.5. Semejanza 595
478
Contenido / 19
CAPíTULO 9
TEMAS
COMPLEMENTARIOS
513
9. l . Aplicaciones a las ecuaciones diferenciales S 13
9.2. Geometría de los operadores lineales sobre R2 521
9.3. Ajustede datos por mínimos cuadrados 535
9.4. Problemas de aproximación: Series de Fourier 543
9.5.Formas cuadráticas 55 1
9.6. Diagonalización de formas cuadráticas; Secciones cónicas 561
9.7. Superficies cuádricas 574
9.8. Comparación de procedimientos para resolver sistemas lineales
9.9. Descomposiciones LU 589
CAPíTULO 10 ESPACIOSVECTORIALESCOMPLEJOS
601
10.1. Númeroscomplejos
601
10.2. Módulo;Conjugadocomplejo;División
610
10.3. Forma polar; Teorema de De Moivre
617
10.4. Espacios vectoriales complejos 628
10.5. Espacios complejosconproducto interior 637
10.6. Matrices unitarias, normales y hermitianas 647
RESPUESTAS A LOS EJERCICIOS
iNDlCE
711
661
S79
CAPíTULO
~
I .I
I
SISTEMAS DE
ECUACIONES
LINEALES Y
MATHCES
INTRODUCCIQN A LOS SISTEMAS DE ECUACIONES LINEALES
El estudio de los sistemas de ecuaciones lineales y sus soluciones es uno de los
temas más importantes del álgebra lineal. En estasección se introducirá terminología básicay se analizará un metodo para resolver esos sistemas.
ECUACIONES
LINEALES
Una recta en el plano xy puede representarse algebraicamente porunaecuaciónde
la forma
u I x+ a,y
=b
Una ecuación de este tipo se denomina ecuación lineal en las variables x y y . De
manera más general, una ecuacidn lineal en las n variables x,, x2,. . . , xn se
define como una ecuación quese puede expresar en la forma
U,X,
+ a2x2+ . . . + U , X ,
=h
donde al, a2, . . . , a,, y b son constantes reaies.Las variables en una ecuación
lineal algunas veces se denominan incógnitas.
Ejemplo 1 Las ecuaciones siguientes son lineales:
x + 3 y = 7x ,
y=+x+3z+ 1
3x, + x, = 7
x,+x*+...+xx,=l
-
2x,
-
21
22
;'
Sistemas de ecuaciones linealesy matrices
Observar que una ecuación lineal no incluye ningún producto o raíz de variables.
Todas las variables están elevadas sólo a la primera potencia y no aparecen como
argumentos de funciones trigonométricas, logarítmicas o exponenciales. Las siguientes ecuaciones no son lineales:
Una solución de una ecuación lineal alxl + a2x2 + . . . , + a>,= b es una
sucesión de n números sl, sz, . . . , sn de modo que la ecuación se cumple cuando
se sustituye x1 = sl, x2 = s2, . . . , x, = S,. El conjunto de todas las soluciones
de la ecuación se denomina conjunto solucidn o, algunas veces, solucidn general de la ecuación.
Ejemplo 2 Encontrar el conjunto solución de
(a) 4x - 2"v = 1
(b) x1 - 4x,
+ 7x3 = 5
Solución a). Para encontrar soluciones de a), se asigna un valor cualesquiera a x
y se despeja y, o bien, se elige un valor arbitrario paray y se despeja x. Si se sigue
el primer método y a x se asigna un valorarbitrario t, se obtiene
y=2t-$
x=t,
Estas expresiones describenel conjunto solución en términos de algún parámetrof.
Lassolucionesnuméricas
particulares se pueden obteneral sustituir valores
específícos de t. Por ejemplo, f = 3 conduce a la solución x = 3, y =
yt=produce la solución x = - T1 ,y = - .
Si se sigue el segundo método y a y se asigna el valor arbitrario t , se obtiene
y,
2
4
Aunque estas expresiones son diferentes a las que se obtuvieron antes, producen el
mismo conjunto solución cuando t asume todos los números reales posibles. Por
ejemplo, con las expresiones anteriores se obtuvo la solución x = 3 , y =
cuando
t = 3, mientras quecon las expresiones posteriores se obtuvo esa solución cuandot
y
-
11
-
2 '
Solución b). Para encontrar el conjunto solución de b) es posible asignar valores
arbitrarios a dos variables cualesquieray despejar la tercera variable. En particular, si a x2 y ,x3 se asignan los valores arbitrarios s y t, respectivamente, y se
despeja xl, se obtiene
x1=5+4s-7t,
x2=s,
x3=t A
1.I Introducción a los sistemas de ecuaciones lineales I’ 23
SISTEMAS
LINEALES
Un conjunto finito de ecuaciones lineales en las variables x,, x,, . . ., x,, se denomina sistema de ecuaciones lineales o sistema lineal. Una sucesión de números S , , S,,. . . , S, se denomina solución del sistema si x1 = sl, x, = S,, . . . , S,, =
xn es una solución de todas y cada una de las ecuaciones del sistema. Por ejemplo,
el sistema
+ 3x,
=
-
31, + x2 + 9x,
=
-4
4x, - x *
1
tiene la solución x, = 1, x2 = 2, x3 = - 1, ya que estos valores satisfacen ambas
ecuaciones. Sin embargo, x1 = 1, x, = 8, x3 = 1 no es una solución, ya que estos
valores satisfacen sólo la primera de las dos ecuaciones del sistema.
No todos los sistemas de ecuaciones lineales tienen solución. Por ejemplo, si
la segunda ecuacióndel siguiente sistema
x+ y=4
2x+2y=6
i,
se multiplica por
resulta evidente que no existen soluciones, ya que el sistema
equivalente obtenido
x +y = 4
x+y =3
está compuesto por ecuaciones contradictorias.
Se dice que un sistemade ecuaciones que no tiene soluciones es inconsistente; si existe por lo menos una solución del sistema, éste se denomina consistente.
Para ilustrar las posibilidades que pueden ocurrir al resolver sistemas deecuaciones lineales, se considerará un sistema generalde dos ecuaciones lineales en las
incógnitas x y y:
u,x+b,y=c,
a2x b,y = c2
+
( a , , b , nosonceroalavez)
( a z ,6,
no son cero a la vez)
Las gráfkas de estas ecuaciones sonrectas; por ejemplo I, y I,. Como un punto (x,
y) pertenece a una recta sí y sólo si los números x y y satisfacen la ecuación de la
recta, las soluciones del sistemade ecuaciones correspondena
intersección de 1, y I,. Existen tres posibilidades (figura 1):
lospuntosde
Las rectas I, y 1, pueden ser paralelas, en cuyocasonose
cortan y, en
consecuencia, no existe solución del sistema.
Las rectas I, y I, pueden cortarse sólo en un punto, en cuyo caso el sistema
tiene exactamente unasolución.
Las rectas I, y 1, pueden coincidir, en cuyocasohayuna
infinidad de
puntos de intersección y, por tanto, existen infinidad de solucionesdel
sistema.
24
Sistemas de ecuaciones lineales y matrices
Aunque aqui sólo se han considerado dos ecuaciones en dos incógnitas, más tarde
se demostrará que las mismas tres posibilidades se cumplen para sistemas lineales
arbitrarios:
Todo sistema de ecuacioneslineales no tienesoluciones,tiene
una solución o tiene una injinidad de soluciones.
exactamente
a)
Figura 1
I M í d a d de soluciones I
No existe solución
Un sistema arbitrario de m ecuaciones lineales en
como
n
incógnitas se puede escribir
umlxl+ am2x2+ . . . + amnx, = b,
donde xl, x2,. . . , x, son las incógnitas y las letras a y b con subindices denotan
constantes. Por ejemplo, un sistema general de tres ecuaciones lineales con cuatro
incógnitas se puede escribir como
Los subindices dobles en los coeficientes de las incógnitas constituyen un
mecanismo útil que se utiliza para especificar la ubicación del coeficiente en el
sistema. El primer subíndice enel coeficiente ay indica la ecuación en queaparece
el coeficiente, y el segundo subíndice indica a qué incógnita multiplica. Así, a I 2
está en la primera ecuación
y multiplica a la incógnita x2.
l .1 Introducción a los sistemas de ecuaciones lineales
MATRICES
AUMENTADAS
,I
25
Si mentalmente se ubica a los signos +, las letras x y los Signos =, entonces un
sistema de m ecuaciones lineales con n incógnitas puede abreviarse al escribir sólo
el arreglo rectangular de números:
a12
a22
am2
...
...
...
a In
a 2"
amn
Este arreglo se denomina mutriz aumentada del sistema. (El término matriz se usa
enmatemáticasparadenotarun
arreglo rectangulardenúmeros.Lasmatrices
surgen en muchos contextos que serán considerados con más detalle en secciones
ulteriores.) Por ejemplo. la matriz aumentadadel sistema de ecuaciones
+ + 2x3 = 9
2x, + 4x2 - 3x3 = I
3x1 + 6x2 - 5x3 = O
x1
x2
es
AI elaborar una matrizaumentada, las incógnitas deben escribirse en el mismo orden en cadaecuación.
El método básico para resoiver un sistema de ecuaciones lineales es sustituir
el sistema dado por un nuevo sistema que tenga el mismo conjunto solución, pero
que sea más fácil de resolver. Este nuevo sistema suele obtenerse en una serie de
pasos mediante la aplicación de los tres tipos de operaciones siguientes para eliminar incógnitas de manera sistemática.
OBSERVACI~N.
1. Multiplicar una ecuación por una constante diferente de cero.
2. Intercambiar dos ecuaciones.
3. Sumar un múltiplode una ecuación a otra ecuación.
Dado que los renglones (líneas horizontales) de una matriz aumentada corresponden a las ecuaciones en el sistema asociado, las tres operaciones mencionadas
corresponden a las siguientes operaciones efectuadas en los renglones de la matriz
aumentada.
1. Multiplicar un renglón por una constante diferente de cero.
2. Intercambiar dos renglones.
3.
Sumar un múltiplo deun renglón a otro renglón.
"
26
/
Sistemas de ecuaciones 1ineales.y matrices
OPERACIONES
ELEMENTALES
EN LOS
RENGLONES
Las tres operaciones anteriores se denominan operaciones elementales en los renglones. En el siguiente ejemplo se ilustra cómo se pueden usar estas operaciones
para resolver sistemas de ecuaciones lineales. Como
en
la
siguiente sección se
obtendrá un procedimiento sistemático paradeterminar soluciones, no es necesario
preocuparse sobre cómo se eligieron los pasos en este ejemplo. El esfuerzo principal en este caso debe dedicarse a comprender los cálculos y el análisis.
Ejemplo 3 En la columna izquierda quese muestra a continuación se resuelve un
sistema de ecuaciones lineales operando sobre las ecuaciones del sistema, y en la
columna de la derecha el mismo sistema se resuelve operando sobre los renglones
de la matriz aumentada.
[:
x+ y+2z=9
2X + 4y - 32 = 1
3~ 6-v - 5~ = O
+
1
4
a
-3
6 - 5
3
Sumar -2 veces la primeraecuación
segunda para obtener
'1
2
O
la
Sumar -2 veceselprimerrenglón
gundo para obtener
al se-
la
Sumar -3 veces el primer renglón al tercero
para obtener
x+ y+2z=
9
2 y - 7 ~-17
~
3~
+ 61'
- 52
O
=
Sumar -3 veces la primeraecuacióna
tercera para obtener
x + y 2+ z =
9
Multiplicar la segunda ecuación por 1/2 para
obtener
x+
y'+
2z=
v-
Sz=
3~ - 1 I Z
=
v"?
Sumar -3 veces el segundo renglón al tercero
para obtener
9
3
2
"
" 7
-
z=
la
17
+ 2z =
2Z
1/2 para
-27
Multiplicarlaterceraecuaciónpor
obtener
x +y
Multiplicar el segundorenglónpor
obtener
9
y-$z="
-
-27
17
x + , y + 22=
2'
2
-7
-11
2
"
Sumar -3 veces la segundaecuacióna
tercera para obtener
- 1"
ia 1 "1'
o
2 ~ -7Z=-17
3 ~ I-I z = -27
-2 para
9
2
3
Sumar el tercer renglón por-2 para obtener
[; -; -;1
1
2
9
1 . 1 Introducción a los sistemas de ecuaciones lineales 1 27
Sumar - 1 veces el segundo renglón al
primero para obtener
Sumar -1 veces la segundaecuaciónala
primera para obtener
x
35
+yz=
y - S z = -17
0
35
~
3
z=
Sumar - 1112 veces el tercer
rengl6n
al
primero y 712 veces el tercer renglón al segundo
para obtener
Sumar - 1112 veces laterceraecuación a la
primera y 7/2 veces la terceraecuación a la
segunda para obtener
0
=1
X
%
0
=2
z ='3
y
La solución
x=l,
z=3
y=2,
es evidente ahora. A
EJERCICIOS DE LA SECCIóN 1.1
1. De las siguientes ecuaciones, ¿cuálesson lineales en x , , xz y x3?
a) xI
+ 5x2 - d
b) xI
e) x:/'
x 3= 1
+
d ) x F 2 + x 2 8x, = 5
+ 3x2 + x,x3 = 2
C)
+ xj = 4
- 2x,
xi = -7x,
+ Jx,
+ ;x3 = 7'13
f ) m ,- f i x 2
2. Dado que k es una constante, p d e s de las siguientesecuaciones son lineales?
1
a)x,-xx,+x,=senk
b) k x i - - x , = 9
k -
c) 2 k x 1 + 7 x 2 - x 3 = 0
3. Encontrar el conjunto solución de cadauna de las siguientes ecuaciones lineales
+
a) 7x - 5.v = 3
C) - 8 x , + 2 x 2 - 5 x 3 + 6 x 4 = 1
b) 3x, - 5x2 4x3 = 7
d ) 3 ~ - 8 ~ + 2 ~ - ~ + 4 ~ = 0
4. Hallar la matnz aumentada de cada uno de los sigwentes sistemas de ecuaciones lineales.
- 2x, = - 1
4x, + 5 x 2 =
3
7x, +3x2 = 2
a) 3x,
+ 2x3 = 1
b) 2x,
3x, - x2
6x1 X,
+
c)
X,
+ 2x2
-
+ 4x,
=7
3x2 + x3
X,
O
x3
-
+
x4
+
x5 = 1
-x5=2
7x4
=1
5. Determinar un sistema de ecuaciones lineales correspondiente
a la matriz aumentada.
a)
[: -9
81
o
b)
[: -:
O
7
c,
[
1
2
2
1 - 3
4
0
51 1
[i i
0
-2
5
-:I
-;]
0
0
o
1
g
4
6. a) Encontrar una ecuación lineal en las variables x y y que tenga la solución general x
=5+2t,y=t.
d) X I
x2
=1
=2
xj = 3
28
Sistemas de ecuaciones lineales .y maírices
b) Demostrar que x = t , y =
inciso a).
if-- también es la solución general de la ecuación del
7. La curva y = ax2 + bx + c de la figura 2 pasa por los puntos (x1,y,), (x2,y,) y (x3,yJ.
Demostrar que los coeficientes a, b y c son una solución del sistema
de ecuaciones
lineales cuya matriz aumentada es
k el siguiente sistema de ecuaciones lineales
tiene soluciones? ¿exactamente una solución'? ¿infinidad de soluciones?
8. ¿Para qué valorirs) de la constante
no
x- y = 3
2~ - 2y = k
9. Considerar el sistema de ecuaciones
+ b-v = k
cx + dy = I
ex + fy = n:
ax
Analizar las posiciones relativas de las rectas ax
cuando el sistema
a) no tiene soluciones.
b) tiene exactamente una solución.
c) tiene infinidad de soluciones.
+ by = k, cx + 4v
=
1 y ex
+fi =
m
10. Demostrar que si el sistema de ecuaciones del ejercicio 9 es consistente, entonces del
sistemaesposibleeliminar
solución.
por l o menosunaecdaciónsinmodificarelconjunto
11. Sean k = I = m = O en el ejercicio 9; demostrar que el sistema debe ser consistente.
iQuC se puede decir del punto de intersección de las tres rectas
si el sistema tiene
exactamente una solución?
12. Considerar el sistema de ecuaciones
x+v+2z=a
x
+
z=b
2x+y+3z=c
Demostrar que para que este sistemasea consistente, a, b y c deben satisfacer c = a + b
13. Demostrar lo siguiente: Si las ecuaciones lineales x,
kx,
+
= c y x, + Ix, = d tienen el
mismo conjunto solución, entonces las ecuaciones son idénticas.
1.2 Eliminación gaussiana / 29
1.2
ELIMINACIÓNGAUSSIANA
En esta sección se dará un procedimiento sistemútico para resolver sistemas de
ecuaciones lineales; el método se basa en la idea de reducir la matriz aumentada
a una forma sujicientemente simple para que el sistema de ecuaciones se pueda
resolver por inspección.
FORMA
ESCALONADA
REDUCIDA
En elejemplo 3 de la secciónprecedente,el
matriz
aumentada
a
sistema lineal se resolvió al reducir la
a partir de lo cual la solución del sistema era evidente. Este es un ejemplo de una
matriz que está en forma escalonada reducida. Para que una matriz sea de esta
forma. debe tener las siguientes propiedades.
1. Si un renglón no consta completamente de ceros, entonces el primer número
diferente de cero en el renglónes un 1. (Que se denomina 1 principal.)
2. Si hay renglones que constan completamente de ceros, se agrupan en la
parte inferior de la matriz.
3. En dos renglones consecutivos cualesquiera que no consten completamente
de ceros, el I principal del renglón inferior aparecemás a la derecha que el
1 principal en el renglón superior.
4. Cada columna que contenga un I principal tiene ceros en todas las demás
posiciones.
Se dice que una matriz conlas propiedades 1, 2 y 3 (pero no necesariamentecon la
propiedad 4) está en forma escalonada.
Ejemplo 1 Las siguientes matrices están en forma escalonadareducida.
[I
o
o
O
O
1
o
o
41
7 ,
1 - 1
[I
O O]
0 1 0 ,
O
o
l
[: A -: y
0
0
o
o
Las siguientes matrices están en forma escalonada
0
0
o
I]
0
o
’
o
[::]
30
1
Sistemas de ecuaciones lineales y matrices
El lector debe verificar que cada una de las matrices anteriores satisface todos los
requisitos necesarios.
Segúnelejemplo precedente, unamatrizenformaescalonada
tiene ceros abajo de cada 1 principal, mientras que una matriz en forma escalonada reducida tiene ceros tanto arriba como abajo decada 1 principal.
los renglones, se llega a
Si, por m d o de una serie de operaciones elementales en
la forma escalonada reducida a partir de la matriz aumentada de un sistema de ecuaciones lineales, entonces el conjunto solución del sistema
será evidente por inspección o
al cabo de unos cuantos pasos simples. Este
hecho se ilustra conel siguiente ejemplo.
ORSERVACI~N.
Ejemplo 2 Suponer que la matriz aumentada de un sistema de ecuaciones lineales
se ha reducido por operaciones en los renglones a la forma escalonada reducida
dada. Resolver el sistema.
1
b) [O
O
c)
1
6
o
o
4 - 2
O
o
0
0
0
0
1
0
5
0
0
1
0
0
0
1
2
3
2
2
0
Solución a). El sistema de ecuaciones correspondiente es
=
XI
5
- -2
x2
4
x3 =
Por inspección se obtiene que x1 = 5 , x2 = -2, x3 = 4
So/ución 6). El sistema de ecuaciones correspondiente es
+ 4x,
+ 2x,
x3 + 3X,
XI
.x2
=
=
=
-
1
6
2
Ya que xl, x2 y xj corresponden a unos principales en la matriz aumentada, se
denominan variables principales. Las variables no principales (en este caso
x4) se denominan variables libres. Al expresar las variables principales en términos de las variables libres se obtiene
XI
= - 1 - 4x,
x2 =
6
-
2 ~ ,
X) =
2
-
3s,
221526
1.2 Eliminación gaussiana / 31
A partir de esta forma de las ecuaciones se observa que a la variable libre x4 se le
puede asignar algún valor, por ejemplo t, que luego determina el valor de las variables principales xl, x2 y x3. Por tanto, existe una infinidad de soluciones y la solución generalestá definida por las fórmulas
Solución c).
El sistema de ecuaciones correspondiente es
x, + 6x,
x3
+ 4x, = - 2
+ 3x5 = 1
x, + SX, = 2
Aquí las variables principales son x,, x3 y x4, y las variables libres son x2,y x5. Al
expresar las variables principales en términos delas variables libres se obtiene
X, =
x3
=
x,
=
- 2 - 6x2 - 4x5
1 - 3x5
2 - 5x5
Puesto que x5 puede asumir un valor cualesquiera t y x2 puede asignarse un valor
S, entonces existe una infinidad de soluciones. La solución general está definida
por las fórmulas
Solución
d).
La última ecuación enel sistema de ecuaciones corresponlente es
ox,
+ ox, + ox,
=
1
Como no es posible que esta ecuación se cumpla, entonces el sistema no tiene
solución. A
ELIIMINACI~N
GAUSSIANA
Se ha visto cuán fácilesresolver un sistemadeecuacioneslineales
una vezque su
matrizaumentada se escribe en forma escalonadareducida. A continuación se proporcionará un procedimiento paso a paso que puede
usarse para expresar cualquiermatriz
en forma escalonada reducida.A medda que se escriba cada paso del prooxhiento, se
ilustmá la idea al expresar la siguiente matriz
en forma escalonada reducida.
0
2
2
Paso 1.
0
-
4
4
Localizarlacolumnade
de ceros.
2
-10
-5
o
6
6
12
-5
-1
la izquierdaque no constecompletamente
317
I/
Sistemas de ecuaciones lineales-v matrices
0
2
2
0
2
o
- 10
6
-5
6
4
4
7
12
-5
If]
-1
! Columna de la orilla izquierda diferente de cero
Paso 2.
Intercambiar el renglón superior con otro renglón, en caso de ser necesario, para que en la parte superior de la columna determinada en
el paso 1 haya un elemento diferente de cero.
2
4
o
0 - 2
Paso 3.
1
2
2
1
o
0
Paso 5.
o
7 1 2
renglones
primero
y segundo
Si el elemento que está ahora en la parte superior de la columna determinada en el paso l es a, multiplicar el primer renglón por l l a a
fin de introducir un 1 principal.
o
Paso 4.
-10
- 5
0 - 2
4 -5
3
6
7
-5
o
6
-1
El primer renglón de la
precedente
matriz
se
multiplicó por 1/2.
Sumar mdtiplos adecuadosdelrenglónsuperior a los renglones inferiores para quetodos los elementos abajo de1 principal se vuelvan ceros.
2
-
5
0 - 2
o
5
3
o
o
El primer renglón de la matriz
precedente
sumó
se
-2 veces
7
-
A continuación, cubrir el renglón superior de la matriz y comenzar
de nuevo con el paso 1 aplicado a la submatriz restante. Continuar de
esta manera hasta que toda la matriz esté en forma escalonada.
1
o
O
2
- 5
0 - 2
O
5
3
0
O
7
-17
-29
Columna de la orilla izquierda
diferente decero en la submatriz
l .2 Eliminación gaussiana / 33
1
2
0
O
-
0
O
1
2
3
1
5
0
O
-
5
o
o
0
1
5
2
-
0
5
0
-?I
~
6
o -;
0
El primer renglón de la
submatriz se multiplicó
por - 1/2 para introducir
un 1 principal.
6
3
1
0
-29
o -;
0
o
o
3
1
0
" 2
-17
0
~
submatriz se sumó - 5 veces '
al segundo renglón de la
1submatriz para introducir un
cero abajo del 1 principal.
El renglón superior de la
submatriz se cubrió, y se
1volvió nuevamente al paso l .
A
Columna de la orilla izquierda diferente
de cero enla nueva submatriz
1
2
-
o
o
0
0
5
1
0
3
0
El primer (yrenglón
Único)
en la nueva submatrlz se
1
2
introducir
un
1 principal.
Ahora toda la matriz está en forma escalonada. Para determinar la forma escalonada reducida esnecesario efectuar el siguiente paso adicional.
Paso 6.
Empezando conel último renglón diferente de cero y trabajando
hacia arriba, sumar múltiplos adecuados de cada renglón a los renglones de arriba conobjetode introducir ceros arriba delosunos
principales.
1
0
0
2
1
0
0
2
1
0
0
5
1
0
3
0
0
6
0
1
3
0
0
o
0
0
5
1
0
0
1
2
0
0
0
1
0
3
0
0
0
0
1
-
0
0
-
precedente se sumó 712 veces
sumó -6 veces al
El segundo renglón se
sumó 5 veces al primer
renglón.
La última matrizestá en forma escalonada reducida
El procedimiento anterior para expresar una matriz en forma escalonadare*
ducida se denomina eliminación de Gauss-Jordan (véase la página 34). Si sólo se
efectúan los cincoprimeros pasos,el procedimiento se denomina eliminación
gaussiana y produce una formaescalonada.
34 1 Sistemas de ecuaciones lineales y matrices
Sepuede demostrarque todamatriztieneuna
forma escalonada reducida única; es decir, se obtiene la misma forma escalonada reducida
deunamatrizdada
sin importar cómose hagan variar las operaciones enlos
renglones. (Una demostración de este hecho puede consultarse en el artículo "The
Reduced Row Echelon Form of a Matrix is Unique: A Simple Prooy, de Thomas
Yuster, Mathematics Magazine, Vol. 57, No. 2, 1984, págs. 93 -94.) En contraste,
una forma escalonada de una matriz dada no es única: diferentes secuencias de
operaciones enlos renglones pueden producir formas escalonadasdiferentes.
OBSERVACI~N.
Ejemplo 3 Resolver por eliminación de Gauss-Jordan
+ 3x,
2x, + 6x2
X]
2x,
+ 6x2
+ 2x,
2x4 + 4x5
-
2x,
-
5x3
-
5x,
+ lox,
+
8x,
+ 4x,
= o
-
3x6 =
+ 15x,
+ 18x,
=
1
5
=
6
-
*KarlFriedrich Gauss (1777-1855) fue un matemáticoycientíficoalemán.Algunasveces
los matemáticos",Gauss
es consideradojunto
con Isaac Newton y
nombrado"príncipede
Arquimedes como uno de los tres más grandes matemáticos que han existido. En toda la historia de
las matemáticas quizá nunca ha habido un niño tan precoz como Gauss: según cuenta éI mismo, ya
dominaba las bases de las matemáticas aún antes de poder hablar. Un dia, cuando aún no tenia tres
Su padre estaba
años de edad, su genio se manifestó a sus padres de manera bastante elocuente.
preparando la nómina semanal de los obreros a su cargo mientras el niño lo observaba en silencio
desde un rincón de la habitación. AI final de los cálculos largos y tediosos, Gauss dijo a su padre
que había un error en el resultado y le dijo la respuesta, a la que había llegado mentalmente. Para
sorpresa de sus padres, jal comprobar los cálculos se dieron cuenta de que Gauss tenía razón!
En su disertación doctoral, Gauss proporcionó la primera demostración completa del teorema
fundamental del álgebra, que establece que toda ecuación polinómica tiene cuando mucho.tantas
soluciones como su grado. A los 19 años de edad resolvió un problema que desconcertó a Euclides:
inscribir un polígono regular de 17 lados en una circunferencia usando sólo regla y transportador; y
Disqursrfrones Anfhrnetrcae,
en 1801,alos24años
de edad,publicósuprimeraobramaestra,
consrderada por muchos como uno de los logros más brillantes en matemáticas. En este documento,
Gausssistematizó el estudiodelateoría
de números(propiedades de los enteros) y formuló los
conceptos básicos que constituyenlos cimientos de ese tema.
Entre la multitud de logros alcanzados, Gauss descubrió la curva "acampanada" o gaussiana que
es fundamental en probabilidad, proporcionó la primera interpretación geométrica de
los números
complejos y estableció el papel fundamental de éstos
en las matemáticas, desarrolló métodos para
caracterizar superficies intrínsecamentepor medio de las curvas contenidasen aquéllas, desarrolló la
teoría del mapeo conforme (que preserva ángulos) y descubrió la geometría
no euclidiana 30 años
antes de que estas ideas fueran publicadas por otros. En fisica realizó contribuciones esenciales a la
teoría de las lentes y a la acción capilar, y junto con Wilhelm Weber realizó trabajo fundamental
en
electromagnetismo, Gauss inventó el heliotropo, el magnetómetro bifilar y el electrotelegrafo.
Gausseraprofundamentereligiosoysecomportabacomoaristócrata.Dominabafácilmente
No le
otrosidiomas,leiabastanteydisfrutabalamineralogiaylabotánicacomopasatiempos.
agradaba dar clases y solía ser frío y poco alentador con otros matemáticos, quizá porque ya había
si Gausshubierapublicadotodos
sus
anticipado el trabajode
éstos. Se haafirmadoque
descubrimientos, el estado actual de las matemáticas habría avanzado 50 años. Sin duda alguna es el
matemático más grande de la epoca moderna.
Wilhelm Jordun (1842-1899) fue un matemático alemán que se especializó en geodesia.
Su
contribuciónalaresolución
de sistemaslinealesapareció
en sulibroconocido, Handbuch der
I'errnessungskunde, en 1888.
1.2 Eliminación gaussiana / 35
La matriz aumentada del sistema es
AI sumar -2 veces el primer renglón alos renglones segundoy cuarto se obtiene
1
L
3
-
o
o
(I
O
O
O
o
2
-2
5 1 0
4
8
o
2
-1
o
o
-3
-1
5
6
0 1 5
O 1 8
Al multiplicar el segundo renglón por - 1 y luego sumar -5 veces el nuevo segundo
renglón al tercer renglón y -4 veces el nuevo segundo renglón al cuarto renglón se
obtiene
O
O
0
0
0
6
2
Al sumar -3 veces el tercer renglón al segundo renglón y luego sumar 2 veces el
segundo renglón de la matriz resultante al primer renglón se obtiene la forma
escalonada reducida
I
1
0
3
0
0
1
4
2
2
0
0
0
0
0
0
0
0
0
0
1
g
0
0
0
0
0
0
0
El sistema de ecuaciones correspondente es
x, + 3x,
4 4x,
x3
+ 2x,
=
o
=o
+ 2x4
X6
=Q
(Se ha eliminado la última ecuación. Oxl + Ox, + Oxj + Ox4 -t Ox, + Ox6 = O, ya
que las demris ccuaciones harán que se cumpla de manera automática.) AI despejar
la,; variables principalcs. se obtiene
Si a las variables libres x,. x4. x5 se asignan los valores arbitrarios r.
respectivamente. entonces la solucion general está dada por las fórmulas
X,
RETROSUSTITUCI~N
=
-
3r
--
4s
-
2t,
X?
.x3 =
= Y,
-
2 ~ ,
.x4 = S,
= t.
X,
S
=
y t.
f A
Ejemplo 4 Algunas Yeces es preferible resolver un sistema de ecuaciones lineales
por medio de la eliminación gaussiana a fin de expresar la matriz aumentada en
forma escalonada sin continuar hasta obtener la forma escalonada reducida.
Cuando se hace lo anterior. el sistema de ecuaciones correspondiente se puede
resolver mediante una técnica denominada retrosustitucidn. Para ilustrar este
método se usarh el sistema de ecuaciones del ejemplo 3.
Con base en los cálculos en el ejemplo 3. una forma escalonada dc la matriz
aumentada es
I
1
0
0
o
3
0
0
0
2
1
0
0
o
2
O
0
0
2
0
0
0
3
l
0
0
1
g
0
Para resolver el sistema de ccuaciones correspondiente
se procede como sigue:
Paso 1.
Despejar las variables principales en las ecuaciones.
.Yl
= -3x,
+ 2x,
xi =
1 - 2.r,
x,
f
=
-
-
3x,
2x,
I
1.2 Eliminación gaussiana / 37
Paso 2. Empezandocon la últimaecuación y trabajandohacia atrás, sustituir
consecutivamente cada ecuación en
las ecuaciones anteriores.
Al sustituir x6 =
3 en la segunda ecuación se obtiene
x, = -3x,
xj =
.X6
La sustitución de x3 = -2x,
-
+ 2x,
- 2x,
2x,
=$
en la primera ecuación da
x, = - 3x, - 4x,
-
2x5
x, = -2x,
x6 =
$
Paso 3. Asignar valores arbitrarios a las variables libres, si hay alguna.
Si a xz. x4 y x5 se asignan valores cualesquiera r, S y t, respectivamente,
entonces la solución general está definida por las fórmulas
Lo anterior concuerda con la solución obtenida enel ejemplo 3. A
OBSERVACI~N. Los valores que se asignan a las variables libres se llaman
parámetros. Aunque para designar a los parámetros en generalse usarán las letras
r , s. t, . . , es posible usar cualquier letra que no cause problema con los nombres
de las variables.
,
Ejemplo 5 Resolver
x+ y+22=9
+ 4y 32 = 1
3x + 6 , ~ 5~ = O
2x
-
-
por medio de la eliminación gaussianay la retrosustitución.
Solución. Este es el sistema del ejemplo 3 en la sección 1 . 1 . En ese ejemplo se
convirtió la matriz aumentada
38
,/
Sistemas de ecuaciones lineales y matrices
a la forma escalonada
[;
1
2
-f
-y]
9
El sistema corresponhente esta
a matriz es
x + y + 22=
-
9
2, = -17
2
z=
3
Al despejar las variables principales se obtiene
La sustitución de la ecuacióninferior en las ecuaciones anteriores da
x=3-y
y=2
z=3
y la sustitución de la segunda ecuación en la ecuación
superior se obtiene
x= 1
y=2
z=3
Estoconcuerda conel resultado que se encontrómediante
Gauss-Jordan enel ejemplo 3 de la sección l .l . A
SISTEMAS
LINEALES
HOMOGÉNEOS
la eliminación de
Se dice que un sistema de ecuaciones lineales es homogéneo si todos los término:
constantes son cero; es decir, el sistema esde laforma
a I l x , + ai2x2+ . . . + a , , x , = O
u2,x, + a22x2+ . . . + u2,x, = O
+
+
amlxl am2x2 . . . + amnx, = O
Todo sistema deecuaciones lineales homogéneo es consistente, ya que UM
solución de todos estos sistemas es x1 = O, xz = O, . . . , xn = O . Esta solución se
denomina solución trivial; en caso de que haya otras soluciones, se denominan
soluciones no triviales.
1.2 Eliminación gaussiana i 39
Debido a que un sistema lineal homogéneo siempre tiene la solución trivial,
entonces para sus soluciones sólo hay dos posibilidades:
El sistema sólo tiene la solución trivial.
El sistema tiene infinidad de soluciones además de la solución trivial
En el caso especial de un
incógnitas, por ejemplo
sistema lineal homogéneo de dos
a,x+h,y=O
( a , , b , nosonceroalavez)
a2x + h2y = O
( a z ,h,
ecuaciones condos
no son cero a la vez)
las gráfkas de las ecuaciones son rectas que pasan por el origen, y la solución
trivial corresponde al punto de intersección en el origen (figura 1).
Av
S Y
Figura 1
I
SÓI~
la solución trivial
I
I Infinidad de soluciones I
Existe un caso en el cual se asegura que un sistema homogéneo tiene soluciones
no triviales, a saber, siempre que el sistema tengamás indgnitas que ecuaciones. Para
ver por qué, considerar elsiguente ejemplo decuatro ecuaciones con cinco incógnitas.
Ejemplo 6 Resolver el siguiente sistema de ecuaciones lineales homogéneo por
eliminación de Gauss-Jordan.
2x1
-x1
+ 2x2
-
x2
x, + x2
-
x3
+ 2x,
+x5=o
-
3x,
-x,=o
- 2x,
x3
+ x5 = o
+
xq
+ x5 = o
Solución. L a matriz aumentada del sistema es
2
-1
o
2 - 1
1
2
1 - 2
0
0
-1
1
-3
1
1
o
o
o
1
0
0 - 1
1
40
/'
Sistemas de ecuaciones lineales y matrices
Al reducir esta matriz a la forma escalonada
reducida, se obtiene
1
0
o
0
[
1
0
0
0
0
1
0
0
0
0
1
0
1
1
0
0
0
0
0
0
El sistema de ecuaciones correspondientees
XI
+
+X?
xj
5 5
=0
+ X5 = o
.x4
=o
Al despejar las variables principales se obtiene
x, =
-x2 -- X.j
x2
= -x5
-Y4
=
o
Par tanto, la solución generales
.x1 =
- S
- t,
.x2 = S,
Xj =
-
t,
XJ
= 0,
xj = 1
Observar quela solución trivial se obtiene cuando S = t = O. A
El ejemplo 6 ilustra dos cuestiones importantes respecto a la soluciónde
sistemas homogéneosde
ecuaciones lineales. Primera,ninguna
de las tres
operaciones elementales en los renglones modifica la columna final de ceros
en la matriz aumentada, de modo que el sistema de ecuaciones correspondiente a
la forma escalonada reducidade la matriz aumentada también debe ser un sistema
homogéneo, véase el sistema (2) . Segunda, dependiendode si la forma escalonada
reducida de la matriz aumentada contiene algún renglón de ceros, el número de
ecuaciones en el sistema reducido es menor o igual que el número de ecuaciones
del sistema original, comparar los sistemas (1) y (2). Por tanto, si elsistema
homogéneo dado contiene m ecuaciones con n incógnitas donde m < n, y s i en la
forma escalonada reducida de la matriz aumentada hay r renglones diferentes de
cero, entonces se tendrá r < n. Seconcluye
que el sistemade ecuaciones
correspondiente a la forma escalonada reducida de la matriz aumentada es de la
forma
1.2 Eliminación gaussiana 1 41
donde xk,,xk2, . . . , xkr son las variables principales y Z ( ) denota Sumas
(posiblemente todas diferentes) que incluyen a las n - Y variables libres, comparar
el sistema (3) con el sistema (2) . AI despejar las variables principales se obtiene
xk,
=
Xk2
=
-X( 1
-G( 1
Xk,
=
-C( )
Así como en el ejemplo 6, es posible asignar valores cualesquiera a las variables
libres del miembro derecho y obtener así una infinidad de soluciones del sistema.
En resumen, se tiene el siguiente teorema importante.
Teorema 1.2.1. Un sistema de ecuacioneslinealeshomogéneo
incógnitas que ecuaciones tiene infinidad de soluciones.
con más
Sedebe notar que el teorema 1.2.1 es válido sólo para sistemas
homogéneos. Un sistema no homogéneoconmás incógnitas que ecuaciones no
necesariamente es consistente (ejercicio 34); sin embargo, si el sistema es consistente, entonces tiene infinidad de soluciones. Este hecho se demostrará después.
OBSERVACI~N.
SOLUCIONES
POR
COMPUTADORA
DE SISTEMAS
LINEALES
En las aplicaciones no es raro encontrargrandessistemas
lineales que cs
necesario resolver por computadora. Zasi todos los algoritmos de cómputo para
resolver los sistemas se basan en la eliminación gaussiana o en la eliminación de
Gauss-Jordan, aunque los procedimientos básicos son modificados a menudo para
poder abordar cuestiones como
reducir los errores por redondeo,
disminuir el uso del espacio de memoria de la computadora,
y resolver el sistema a la velocidad máxima.
Algunas de estas cuestiones se consideraránen
el capítulo 9. En cálculos
manuales, las fracciones son un inconveniente que a menudo es imposible evitar.
Sin embargo, en algunos casos sí se puede hacer al variar de manera conveniente
las operacioneselementalesen los renglones. Por tanto, una vez que ellector
domine los métodosde eliminacióngaussiana y eliminación deGauss-Jordan
puede modificar los pasos en problemas específicos a fin de evitar las fracciones
(véase el ejercicio 18).
EJERCICIOS DE LA SECCIÓN 1.2
1. De las siguientes matrices 3 x 3, ¿cuáles están en forma escalonada reducida?
42
/
Sistemas de ecuaciones lineales y matrices
[:]
["
a ) O l O
1 "1
b)
"1
[:1 y] [A 0" f]
:] [: '1 [:I :]
c)
d)
O 0 0
O 0 0
g)[:
f ) l O O
O 0 0
hj
i)
O 0 0O 0 0
0 0 0
O 0 0
2. De las siguientes matnces 3 x 3 , ¿cuáles están en forma escalonada?
[l
"1
:]
a ) O l O
c)
b ) [ iO 0 0
[i f
1
3
4
0
0
1
o o
d) -0
O 2 0
3. En cada inciso, determinar si la matriz está en forma escalonada, en forma escalonada
reducida, en ambas formaso en ninguna.
p
1 2 0 3 0
a )[O O oO O O O]I
0 0 0 0 0
dl
['
o
-71
b)[i
'1
3
'1
c j [ 'o 1
o 2 4
1 3 0 2 0
2
e)
['
O
o
0
*0
0
f)
O]
1
[i i]
0 0 0 0 0
4. En cada inciso, suponer que la matriz aumentada de un sistema de ecuaciones lineales
los renglonesalaformaescalonada
hasidoreducidamedianteoperacionesen
ducida dada. Resolver el sistema.
1
o
I
0 - 3
o
1
1 - 6
O
~
0
0
0
;]
O
O
3 - 2
1
0
4
0
1
5
0
0
0
0
d)
x
[i -: 81
,)[O
O
0 - 7
O
3
o
o
1
1
-
re-
8
2
5
0
5. En cada inciso, suponer que la matriz aumentada de un sistema de ecuaciones lineales
ha sido reducida mediante operaciones en los renglones a la forma escalonada dada.
Resolver el sistema.
01
-31
0
0
42
1
q
s
2
1.2 Eliminación gaussiana / 43
6. Resolver cada uno de los siguientes sistemas aplicando eliminación de
Gauss-Jordan.
a) x, + x2 + 2x3 = 8
b) 2x, + 2x, + 2x3 = O
-x1 - 2x2
3x, - 7x,
c)
+ 3x3 = 1
+ 4x3 = 10
-2x,
8x,
d)
xy- + 2 z w=-1
2x+y-22-2w=-2
- x + 2 y - 4 2w+=
1
3x
- 3w = -3
+ 5x, + 2x3 = 1
+ X, + 4x3 = - 1
-2b + 3 ~ = 1
3~+6b-3~= -2
6a 66 3c = 5
+ +
7. Resolver cada uno de los sistemas delejercicio 6 aplicando eliminación gaussiana.
8. Resolver cada uno de los siguientes sistemas aplicando eliminación de Gauss-Jordan
a) 2x, - 3x2 = -2
b) 3x, 2 ~ ,- x3 = - 15
5x, 3x2 2x3 =
o
2x,
x, = 1
3x, +2x2 = 1
3x,
x, + 3x3 = 11
-6x, - 4x,
2x3 = 30
+
+
C)
+
+
4x, - SX, = 12
d)
3x1 - 6 ~ ,= 9
-2x, +4x,= 32-xz6y++2 w =
+
+
1oy-4z+
x + 4y- z +
1
2
5
- 2 ~ - 8 y + 2 ~ - 2 ~ -=4
X 6y+32
=
1
w=
w =
9. Resolver cada uno de los sistemas del ejercicioS aplicando eliminación gaussiana.
10. Resolver cada uno de los siguientes sistemas aplicando eliminación de Gauss-Jordan.
a)
5x,
-2x,
-
+
2x2
x,
+ 6x, = O
+ 3x3 = 1
+
+
x, - 4x, = 1
3x2
7x3
2x, = 2
x1 - I ~x1,IX,
- 16x4= 5
b) xI - 2x,
XI
+
+
c)
w + 2 x y- = 4
x - y=3
~ + 3 ~ - 2 ~ = 7
2u+4v=
+7
w+7x
11. Resolver cada uno de los sistemas del ejercicio 10 aplicando eliminación gaussiana
12. Sin usar lápiz y papel, determinar cuáles de los siguientes sistemas homogéneos tienen
soluciones no triviales.
b) x, + 3x2 - x3 = 0
a) 2x1 - 3x, + 4x, - x, = O
7x,
x, - 8x3 + 9x4 = o
x, - SX, = o
4x3 = o
2x, + 8x2 + x3 - X, = O
+
C) a , ,x,
aZlXl
+ alzx2 + uI3x3 = O
+ a2zx2 + a23x3 = 0
13. Resolver los siguientes sistemas
quier método.
a) 2x,
x,
+ X, + 3x3 = O
+ 2x,
=O
x, + x, = o
d) 3x1 - 2x2 = 0
6x,
- 4x2 = O
de ecuaciones lineales homogéneos aplicando cual-
b) 3x1 + x2 + x3 + x, = O
5x, - x2 + x3 - x, = o
c)
2x
+ 2y + 4z = o
W
- y-3.?=0
2w+3x+ y + z=O
-2w+ ~ + 3 ~ - 2 ~ = 0
14. Resolver los siguientes sistemas de ecuaciones lineales homogéneos aplicando cualquier método.
44
1'
Sistemas de ecuaciones lineales y matrices
a) 2.r
-- y - 3z = 0
--x + 2y - 32 =
b)
o
x+ ,y+4z=o
u t 3w-2x=o
2u+ u-4w+3x=o
2 ~ + 3 ~ + 2x =~O -414 - 3U + 5W -. 4x = 0
c) x , + 3 x ,
+x,=o
x, t 4x,
2x,
=o
- 2x2 - 2x, - x, = o
+
2x,
x,
.-
-
4x,
+ x, + x
,= o
2x, - xj + .x4 = o
15. KesoIver 10s siguientes sistemas aplicando cualquier método.
a) 21, - I,
4
+ 31, + 41,
b)
9
=
+ 71, = I 1
+ l3+ 51, = 8
- 21,
31,
-
21,
+
31,
I2 t 41,
+ 41,
z, + z,+ z,= o
-z,- z, + 22, - 32, + z, = o
z, +- z2- 22,
22,+ 2z2 -
= 10
z,
-z,=o
+z,=o
16. Resolver los siguientes sistemas, donde a, b y c son constantes.
a) 2x
3x
+ .V = a
+- 6~ = h
b) x,
2.r
,
+
.x2
3.Y2
+ x
,=u
+ 2x, = h
+ 3x, = c
17. ¿Paraqué
valores de a elsiguientesistemanotienesolución?¿exactamente
solución'? ¿,intinidadde soluciones?
.Y i- 21'
31
4x
"
3z = 4
"~
J' 4-
+ v+
una
5z = 2
--
(U'
1 4 ) ~= 0 + 2
18. Expresar
en forma escalonada reducida sin introducir ninguna fracción
1Y. Encontrar dos formas escalonadas diferentes de
20. Resolver e1 siguiente sistema de ecuaciones no lineales para los ángulos desconocidosa,yp,dondeO(a(2n,OIPI2n,yOsy<:.
2 s e n ac-o s p + 3 t a n y = 3
4sencu+2cosp-2tany=2
6sena-3cosp+
tany=9
21. Resolvcr el siguiente sistema de ecuaciones
no lineales para .Y, y y z.
X'
+ +
z2 = 6
x"y'+22=2
2x2
fV2
-
22 =
3
1.2 Eliminación gaussiana \ 45
22. Demostrar que el siguiente sistema no lineal tiene 18 soluciones si O 5 a 5 2 z,
O 5
/352z,yOI.y<2z.
sena+2cosp+3tany=O
2sena+5cosp+3tany=O
-sena-5cosp+5tany=O
23. $ara que valor(es)de
triviales?
y elsiguientesistemadeecuacionestienesolucionesno
(a - 3lX +
x
v=o
+ (a - 3)?, = o
24. Considerar el sistema de ecuaciones
ax
cx
ex
+ by = O
+ dy = o
+ fy = O
Analizar las posiciones relativas de las rectas ax + by = O, cx + dy = O y ex +fi= O
cuando
a) el sistema tiene s3!0 la solución trivial, b) el sistema tiene soluciones no tnviales.
25. En la figura 2 se muestra la gráfica de una ecuacióncúbica y =
Encontrar los coeficientes a, b , c y d.
+ b? + cx + d.
ty
20
'
-
I
Figura 2
26. Recordar que en geometría plana tres puntos no colineales determinan una
circunferencia de manera única. En geometría analítica se demuestra que la ecuación de una
circunferencia en el planoxy es de laforma
ux2
+ uy2 + bx + cy + d = O
Encontrar la ecuación de la circunferencia que se muestra en
figura
la 3
CY
46
/
Sistemas de ecuaciones linealesy matrices
27. Describir las posibles formas escalonadas rqiucidas de
28. Demostrar que si ad - bc
f
O, entonces la forma escalonada reducida de
29. Usar el ejercicio 28 para demostrar que si ad - bc = O, entonces el sistema
ux
CY
+ b ~=, k
+ dv = I
tiene exactamente una solución
30. tlrsolvzrelsistema
para x,, x 2 y x j SI
a) k = 1 b) d = 2
31. Considerar el sistema de ecuaciones
ux
C.Y
+ bj. = o
+ 41) = o
a) Demostrar que si x = xo, y = y, es cualquier solución del sistema y k es cualquier
constante, entoncesx = kr,, y = 4,también es una solución.
b) Demostrar que si x = xo, y = y, y x = x], y = y , son dos soluciones cualesquiera,
,
es una solución.
entonces x = x. + x,, y = y o + ytambién
32. Considerar el sistema de ecuaciones
+
+ dl) = I
(1) u . ~ b,, = k
C.Y
(11) ax
cx
+ by = O
+ 4v = o
a) Demostrar que si x = x,, y = y , y x = x*, y = y, son soluciones de I, entonces x = x1
- x2,y = y I - es una solución de I I .
b) Demostrar que si x = x], y = y , es una solución de I y x = x,, y = y, es una solución
de I I , entonces x = x , + x,, y = y , + y es
o una solución deI.
y,
33. a) En el sistema de ecuaciones numerado
con ( 3 ) , explicar por qué seríaincorrecto
denotar a las variables principales por xl, x2, , . . ,xr en vez de por xk,, xk2,. . . , xk,
como se hizo.
l .3 Matrices y operaciones con matrices / 4 7
b) El sistema de ecuaciones numeradocon (2) es un caso específico de (3). ¿Qué valor
tiene y en este caso? ¿Cuáles son xk,,xk2,. . . , x en este caso? Escribir las sumas
k,
denotadas por I:( ) en ( 3 ) .
34. Encontrar un sistema lineal inconsistente quetenga más incógnitas que ecuaciones
1.3 MATRICES Y OPERACIONES CON MATRICES
'
N O T A C I ~ NY
TERMINoLoGÍA
DE MATRICES
Los arreglosrectangulares de númerosreales surgen en muchoscontextos
distintos a las matrices aumentadas de sistemas de ecuaciones lineales. E n esta
secciónestosarreglos se considerarán como objetos en sí y se desarrollarán
algunas de sus propiedades para aplicarlas más tarde.
Definición. Una matriz es un arreglo rectangular de números. Los números en
el arreglo se denominanefementosde la matriz.
Ejemplo 1 Algunos ejemplos de matrices son
El tamaiio de una matriz se describe en términos del número de renglones
(líneas horizontales) y de columnas (líneas verticales) que contiene. Por ejemplo,
la primera matriz del ejemplo 1 tiene tres renglones y dos columnas,de modo que
su tamaño es 3 por 2 (que se escribe 3 X 2). En la descripción del tamaño, el
primernúmerosiempredenota
el númeroderenglonesy
el segundo, el de
columnas. Las demás matrices del ejemplo 1 son de tamaño 1 X 4, 3 x 3, 2 X 1 y
1 X 1, respectivamente. Una matriz conuna sola columna se denomina matriz columna (o vector columna),y una matriz con un solo renglón se denomina matriz
renglón (o vector renglón). Así, en el ejemplo 1, la matriz 2 X 1 es una matriz
columna, la matriz 1 X 4 es una matriz renglón y la matriz 1 X 1 es tanto una
matriz renglón como una matriz columna. (El término vector tiene otro significado que será analizado en capítulos ulteriores.
OBSERVACI~N. Se acostumbra omitir los corchetes en una matriz 1 X 1. Así, se
podría escribir 4 en vez de 4 . Aunque lo anterior imposibilita saber si 4 denota el
número "cuatro1'o la matriz 1 X 1 cuyo elemento es 'Icuatro", excepcionalmente
causa problemas, ya que casi siempre es posible inferir el significado a partir del
contexto en que apareceel símbolo.
48
.Sistemas de ecuaciones lineales y matrices
Paradenotarmatrices
se usarán mayúsculas y paradenotar
minúsculas; así. se podría escribir
cantidades,
Al estudiar matrices, es común denominar escdares a las cantidades numéricas.A
menos que se establezca otra cosa. los escalares serán nitmerosreales; los
escalares complejos serán considerados enel capítulo 10.
El elemento que aparece en el renglón i y la columna j de una matriz .4 se
denota por a,,.
Así, una matriz general 3 X 4 se puede escribir como
y una matriz generalm x n, como
Cuando se desea que la notación sea
expresar como
condensada, la matriz precedente se puede
[U,,I,,,X,I
0
[%,I
la primera notación se usa cuando enel análisis es importante conocerel tamaño y
la segunda cuando no es necesario recalcar el tamaño. Por lo general, la letra que
denota una matriz corresponde a la letra que denota sus elementos; así, para una
matriz B en general se usará b,, para denotar el elemento en el renglón i y la
columnaj, y para una matrizC se usará cy.
El elemento en el renglón i y la columna j de una matriz A se denota por el
símbolo (A)q.Así. para la matriz (1) anterior, se tiene
( A ) , , = a,,
y para la matriz
se tiene (A)11 = 2, (A)12 = -3, (A)2l = 7 , y (A)22= O .
Las matrices renglóny columna revisten especial importancia y se denotan con
minúsculas negritas en vez de mayúsculas. En estas matrices es innecesario usar
subindices dobles paralos elementos. Entonces, una matriz renglón generala 1 X
n y una matriz columna general b m X 1 se escribirán como
1.3 Matrices y operaciones con matrices / 49
Una matriz A con n renglones y n columnas se denomina matriz cuadrada
n,-y se h c e que los elementos a l l , a22, . . . , ann están en la diagonal
de A (véanse los elementos entipo negro en la figura 1).
de orden
principal
Figura 1
OPERACIONES
CON MATRICES
Hasta el momento, las matrices se han usado para abreviar el trabajo al resolver
sistemas de ecuaciones lineales. Para otras aplicaciones, sin embargo, es deseable
desarrollar una "aritmética de matrices" en la que sea posible sumar, restar y multiplicar matrices de manera útil. El resto de esta sección se dedicará al desarrollo
de esa aritmética.
Definición. Dos matrices son iguales si tienen elmismo tamaño y sus elementos correspondientes soniguales.
En notación matricial, si A = [a,] y [B = b, ] son del mismo tamaño, entoncesA
B si y sólo si (A), = (B), o, equivalentemente, a, = bo para todo i y j .
=
Ejemplo 2 Considerar las matrices
Si x = 5, entonces A = B, pero para los demás valores de x las matrices A y B
no son iguales. ya que no todos sus elementos correspondientes son iguales.
No hay ningún valor de x para el que A = C, ya que los tamaños de A y C son
diferentes. A
correspondientes de A , y la diferencia A - B es la matriz obtenida al restar los
elementos de B de los elementos correspondientesde A . No es posible sumar o
restar matrices de tamaños diferentes.
6
50
7
' P
.,*<
-
r"*I
: ,, ~'i . .
:
,
Sistemas de ecuaciones lineales v matrices
En notación matricial, si A
=
[au]y B = [ b J son del mismo tamaño, entonces
Ejemplo 3 Considerar las matrices
2
-1
1
O
4 - 2
0
2
7
'1
B=[
o
-4
2
3
3
5
2
O
2 - 4
-:]
C=['
5
'1
2
2
Entonces
11
-5
Las expresionesA + c', B + C', A - C y B - C no están definidas. A
Definición. Si A es cualquier matriz y c es cualquier escalar, entonces el
producto cA es la matriz obtenidaal multiplicar cada elemento deA por c.
En notación matricial, si A
=
[ a 1, entonces
r/
cA)ij = c(A),, = cui,
Ejemplo 4 Para las matrices
2
A=[1
3 4
3 I]
o
B = [ -1
2
3
- 571
c=
[: -r,
se tiene
Es común denotar (- l)B por -B. A
Si A , , A,, . . . , A,, son matrices delmismo tamaño y cl, c,, . . . , c,, son
escalares. entonces una expresión dela forma
se denomina combinación lineal de A , , A,, . . . , A,, con coeficientes cl, c 2 , . .
e,,. Por ejemplo, si A , B y C son las matrices del ejemplo 4, entonces
. ,
224526
=
=
1.3 Matrices y operaciones con matricesI' 51
-:I+[; -: :I
[:1 ;l.+[:1:
[7
3
4
1'
11
i.
es la combinación lineal de A , B y C con coeficientes escalares 2, - 1 y
Hasta elmomento se ha definido la multiplicación de una matnz por un
escalar, pero no la multiplicación de dos matrices. Como la suma de matrices se
ejecuta sumando los elementos correspondientes y la resta de matrices se ejecuta
restando los elementos correspondientes, parecería natural definir el producto de
matrices como la multiplicación de los elementos correspondientes. Sin embargo,
resulta que la definición no es demucha utilidad enla mayor parte delos
problemas. La experiencia ha llevado a los matemáticos a la siguiente definición,
menos natural pero más útil, de producto de matrices.
Definición. Si A es una matriz m x r y B es una matriz r x n, entonces el
producto A B es la matriz m x n cuyos elementos se determinan como sigue.
Para encontrar el elemento en el renglón i y en la columnaj de AB, considerar
sólo el renglón i de la matriz A y la columnaj de lamatriz B. Multiplicar entre
sí los elementos correspondientes del renglón y de la columna mencionados y
luego sumarlos productos resultantes.
, ,
i
. ',
6
Ejemplo 5 Considerar las matrices
I
O
I '
j
'
4
1
4
O
2
-1
7
5
3
-
2
1
-
3
Como A es una matriz 2 x 3 y B es una matriz 3 x 4, el producto A B es una
matriz 2 X 4.Para determinar, por ejemplo, el elemento en el renglón 2 y en la
columna 3 de AB, sólo se consideran el renglón 2 de A y la columna 3 de B.
Luego,comose ilustra a continuación, los elementos correspondientes (en tipo
negro) se multiplican entre sí y se suman los productos obtenidos.
El elemento en el renglón1 y eyi In columna 4 de AB (en negro)se calcula como sigue.
l(1.3)
+ ( 2 . 1 ) + (4.2)
= 131
Los cálculos para los demás productos son
(1 '4)
+ ( 2 . 0 ) + (4.2) =
12
(1.1)-(2.1)+(4.7)=
27
(1.4)+(2.3)+(4.5)=
30
12
8
8
(2.4)
+ (6.0) +- (0.2) =
(2. 1) - ( 6 . 1 )
(2.3)
+ (0.7) =
27
-4
30
26
12
131
-4
+ (6.1) + ( 0 . 2 ) =
12
A
Paraformar elproductoAB, la definición de multiplicación de matrices
requiere que el número de columnas del primer factor A sea el mismoque el
número de renglones del segundo factor B . Sinose
cumple esta condición.
entonces el producto está indefinido. Una manera conveniente para determinar si
el producto de dos matrices está definido es escribir el tamaño del primer factor y,
a la derecha, escribir el tamaño delsegundo factor. Si, comose observaen la
figura 2, los números interiores son iguales, entonces elproducto está definido.
Los númcros exteriores proporcionan entonces el tamaño del producto.
A
m
b
Figura 2
x
r
A
r
h
H
x
n
S
-
AB
m x n
Medios
Extremos
Ejemplo 6 Suponer que A , B y C son matrices con los siguientes tamaños:
A
3 x 4
R
4x7
C
7x3
Entonces A B está definido y se trata de una matriz 3 x 7 ; CA está definido y se
trata de una matriz 7 X 4; y BC está definido y se trata de una matriz 4 x 3. Los
productos AC, CB y BA están indefinidos.
Si A = [u,] es una matriz general m x r y B = [b,] es una matriz general Y X
n, entonces como se ilustra con tipo negro de la figura 3 , el elemento (AB)v en el
renglón i y la columnaj de AB está definido por
1.3 Matrices y operaciones con matrices / 53
AB =
Figura 3
PARTICI~NDE
MATRICES
Una matriz se puede subdividir o partir en matrices más pequeñas insertando
rectas horizontales y verticales entre renglones y columnas selectos. Por ejemplo,
a continuación se muestran tres posibles particiones de una matriz general A 3 X
4: la primera es unapartición de A en cuatro submatrices A 1, A 12, A , y A,2; la
segunda es unapartición de A en sus matrices renglón r l , r2, r3 y r4; y la tercera
es una partición deA en sus matrices columnacl, c,, c3 y c4:
A
=
A =
MULTIPLICACIóN DE
MATRICES
POR COLUMNAS
Y POR
RENGLONES
[:::
'I2
'31
'32
'33
""""_"
_"" " " "
a12
u13
u22
a23
'31
'32
'33
"""""_
1::
\
'13
'14
u22 u23
u24]
=
~
'34
'14
=
a34
[ii:
[il
'I2]
A22
Algunas veces es necesario encontrar un renglón o una columna particulares de
un producto A B de matrices sin calcular todoel
producto. Los siguientes
resultados, cuyas demostraciones sedejancomoejercicios,son
útiles para este
propósito:
j-ésima matriz columna deAB = A b-ésima matriz columna deB ]
1 i-ésima matriz renglón deAB
=
(3 1
(i-ésima matriz renglón de1;3 B
I.".
Ejemplo 7 Si '4 y B son las matrices del ejemplo 5 , entrnces por (3) la segunda
matriz columnade AB se puede obtener al calcular
54 / Sistemas de ecuaciones lineales y matrices
L
I
,"I
t
Segunda columna
deB
1
Segunda columna
deAB
I
y por (4), la primera matriz renglónde A B se puede obtener alcalcular
11
2
I
1' -:
41 0
L2
=
7
[12 27
30
131-,
21
5
I
Primer renglón
1
1
I
I
Si al, $, . . . , a, denotan las matrices renglón de A y b,, b,, . . . , b, denotan
las matrices columna deB , entonces por las fórmulas (3) y (4) se concluye que
(AB calculada renglón por rengldn)
OBSERVACI~N. Las fórmulas (5) y (6) son casos especiales de un procedmiento
más general para multiplicar matrices divididas (véanse los ejercicios 15, 16 y 17).
PRODUCTOS
DE MATRICES
COMO
COMBINACIONES LINEALES
Lasmatricesrenglónycolumnaproporcionan
otra manera de concebir la multiplicación de matrices. Por ejemplo, suponerque
all
A=
Entonces
a22
a21
.
a12
" '
al,
' . '
a2n
1.3 Matrices y operaciones con matrices / 55
En palabras, la fórmula (7) establece que el producto A x de una matriz A y una
matriz columna x es una combinación linealde las matrices columna de A con los
coejicientes que provienen de la matriz x. En los ejercicios de la sección se pide al
lector demostrar que el producto yA de una matriz y 1 X m y una matriz A m X n
es una combinación lineal de las matrices renglónde A con coejcientes escalares
que provienen de y.
Ejemplo 8 El producto matricial
se puede escribir como la combinación lineal
2[-i]-1
y el producto matricial
[I
-9
-:]
-3][-/
= 1-16
8
351
-2
se puede escribir como la combinación lineal
1[-1
3
21-9[1
2
1
-31-3[2
- 2 ] = [ - 1- 61 8
351 A
Por (5) y (7) se concluye que la j-ésima matriz columna de un producto AB es
una combinación lineal de las matrices columna de A con los coeficientes que
provienen de la j-ésima columna de B.
Ejemplo 9 En el ejemplo 5 se demostró que
AB=
2
2
6
4
1
411[ 0 - 1
0 2
7
4
3
-
3
1
5
2-
Las matrices columna de A B se pueden expresar como combinaciones lineales de las
matrices columnade A en la forma siguiente:
['E]
= 4 [ ; ] + 0 [ ; ]+ 2 [ $
FORMA
MATRZCIAL DE
UN SISTEMA
LINEAL
La multiplicación de matrices tiene
una
aplicación importante
a los sistemas de
ecuaciones lineales. Considerarcualquiersistemade rn ecuaciones lineales con n
incógnitas.
CI,,Xl
aZ,xl
+ a12.5 + + LI,,J, = h ,
+ a22x7+ . . . + a2n.x,= b2
' '
'
Como dos matrices son iguales si y sólo si sus elementos correspondientes son
iguales, es posible sustituir las m ecuaciones lineales en este sistema por la simple
ecuación matricial
La matriz m X 1 en el miembro izquierdo de esta ecuación se puede escribir como
un producto para obtener
por A , x y b, respectivamente, entonces el sistemaoriginal
Si estas matrices se designan
de m ecuaciones conn incbgnitas ha sido reemplazadopor la ecuación matricial
Ax=b
La matriz A en esta ecuación se denomina matriz de coeficientes del sistema. La
matriz aumentada del sistema se obtiene adjuntando b a A como última columna;
así, la matriz aumentadaes
l .3 Matrices y operaciones con matrices/ 5 7
TRANSPUESTA Esta
sección termina con la definición de dos operaciones matriciales quecarecen
DE UNA MATRIZ de análogo en los números reales.
Definición. Si A es cualquier matriz m X n, entoncesla transpuestade A ,
denotada por AT, se define como la matriz n X m que se obtiene al intercambiar
los renglones y las columnas de A ; es decir, la primera columna de AT es el
primer renglón de A, la segunda columnade AT del segundo renglónde A , y así
sucesivamente.
Ejemplo 10 A continuación se presentanalgunos ejemplos dematrices y sus
transpuestas.
;;; ;;;
'12
A=[:!:
'13
;J:]
2
B=[t
'14
3
i]
C=[l
3 51
0=[41
Observar no sólo que las columnas de AT son los renglones de A , sino que
los renglones de AT son las columnas de A . Así, el elemento en el renglón i y la
columnaj de A es el elemento en el renglónj y la columna i de A , es decir,
Observar la inversión de los subindices.
En el caso especial en que A es una matriz cuadrada, la transpuesta de A se
puede obtener al intercambiar los elementos simétricos con respecto a la diagonal
principal (figura 4). Planteado de otra forma, A T se puede obtener "reflejando" A
con respecto a su diagonal principal.
1
"2
4
-1-
-2
>..
,f
4
simétricos con respecto a la
Figura 4
1
3
-5
58
:'
Sistemas de ecuaciones linealesy matrices
TRAZA DE UNA
MATRIZ
Definición. Si A es una matriz cuadrada, entonces la truzu de A , denotada por
tr(A), se define como la suma delos elementos de la diagonal principal de A . La
traza de A no está definida si A no es una matriz cuadrada.
CUADRADA
Ejemplo 11
trazas.
A continuación se presentanalgunos ejemplos dematrices y sus
2
I tr(A)=a,,+a,,+a,, I
7
0
-2
Itr(B)= - 1 + 5 + 7 + 0 = 1 1
J
EJERCICIOS DE LA SECCIÓN 1.3
1. Suponer queA , B, C, D y F son matrices de los tamaiios siguientes:
A
B
C
D
E
(4 x 5)
(4 x 5 )
(5 x 2 )
(4 x 2 )
(5 x 4)
Determinar cuáles de las siguientes expresiones de matnces están definidas. Para las
que estén definidas, proporcionar el tamaño de la matriz resultante.
a) BA
e) E(A
/
c).4E+B
d).4B+B
h) ( A
E)D
g) ETA
2. Resolver la siguiente ecuación matricial paraa, b, c y d.
bjAC+D
f ) E(AC)
+ B)
[
-
a-b
" c ] = [ ;
3 d +2c a - 4 d
+
A]
3. Considerar las matrices.
6
-1
Calcular lo siguiente (en caso de ser posible)
a) D + E
e) 2 B - C
i) tr(D)
b)D-E
f) 4E-2D
j) tr(D - 3 E )
c) 5 A
g) - 3 ( 0 + 2 E )
k) 4 tr(7B)
d) -7C
h) A - A
1) ' tr(A)
4. Con las matrices del ejercicio3, calcular lo siguiente (en caso de ser posible)
d ) B T + 5C7
c) ( D - E)'
h) (2ET - 30')'
g) 2ET - 30'
5. Usar las matrices del ejercicio3 para calcular lo siguiente (en caso de ser posible).
a) U ' + C
e) $ C ' - ~ A
a) AB
e) A W )
i) tr(DD')
b) D T - E'
f) B-B'
b) BA
f ) cc'
j ) tr(4ET- D )
c ) (3E)D
g) (DA)'
k) tr(CTAT+ 2E')
d ) (AWC
h) (C 'B)A
'
1 3
1 2
4 1 3
A
1.3 Matrices y operaciones con matrices / 59
6. Mediante las matrices delejercicio 3 , calcular lo siguiente (en caso de ser posible)
a) (2DT- E ) A
d) ( B A T - 2C)T
C) ( -AC)T + 5D7
f ) D T E T - (ED)'
b) (4B)C + 2 B
e) B T ( C C T - A T A )
Con el método del ejemplo 7 , encontrar
a) el primer renglón de A B , c) lasegunda columna de A B , e) eltercer renglón de AA, y
b) el tercer renglón de AB, d) la primera columna de BA, f) la tercera columna de A A .
8. Sean A y B las matrices del ejercicio 7.
a) Expresar cada matriz columna de AB como una combinación lineal de las matrices
columna de A .
b) Expresar cada matriz columna de BA como una combinación lineal de las matrices
columna de B.
Demostrar que el producto YA se puede expresar como una combinación lineal de las
matrices renglón de A con los coeficientes escalaresde y.
10. Sean A y B las matrices delejercicio 7.
a) Usar el resultado del ejercicio 9 para expresar cada matnz renglón de AB como una
combinación lineal de las matricesrenglón de B.
b) Con el resultado del ejercicio 9 expresar cada matnz renglón de BA como una combinación lineal de las matncesrenglón de A.
11. Sean C, D y E las matrices del ejercicio 3 . Efectuando el menor número de cálculos
posible, determinar el elemento en el renglón 2 y en la columna 3 de C(DE).
AB y BA están definidos, entonces AB y BA son matnces cuadradas.
b) Demostrar que si A es una matriz m X n y A(BA) está definido, entonces B es una
matriz n X m.
12. a) Demostrar que si
13. En cada inciso determinar las matricesA , x y b que expresen el sistema de ecuaciones
lineales dado como una simple ecuación matricial Ax = b.
a) 2 x , - 3x2 + 5x3 =
9 x , - x2
XI
+
+
x3 =
5x, + 4x3 =
-
7
1
o
- 3x, + x4 = 1
5x,
x2
- 8x4 = 3
2 x , - 5x2 9x, - x j = o
3x2 - x3 + 7x, = 2
b) 4x,
+
+
14. En cada inciso expresar la ecuación matncial como un sistema de ecuaciones lineales.
60 / Sistemas de ecuaciones lineales y matrices
15. Si '4 y B se dividen en submatrices, por ejemplo
entonces AB se puede expresarcomo
los tamañosdelassubmatrices
A y B seantalesquelas
en elsupuestodeque
operacionesIndicadas se puedanefectuar.Estemétodoparamultiplicarmatrices
divididas se denomina mukiplicwidn en bloque. En cada inciso, calcular el producto
por medio de multiplicación en bloque. Comprobar los resultados multiplicando directamente.
-1
1
2
1 1 5
5
6 1 1
I
2
5=[
p
;
-1
i 1'
'
"
"
"
"
"
"
"
O
j-3
15 paracalcularlossiguientesproductosmediante
16. Adaptarelmétododelejerciclo
multiplicación en bloque.
1
41
1
5
1
4
5
"1
7
-2
0 ; -1
2
17. En cada inciso, determinar si la multiplicación en bloque se puede usar para calcular
AB a partir d e las particiones dadas. En caso afmativo, calcular el producto mediante
multiplicación en bloque.
1.4 Inversas; reglas de la aritmética de matrices / 61
18. a) Demostrar que siA contiene un renglónde ceros y B es cualquier matriz para la que
AB está definido, entoncesAB también contiene un renglón de ceros.
b) Encontrar un resultado semejante, pero respectoa una columna de ceros.
19. Sea A cualquier matriz m X n y sea O la matriz m X n, cada uno de cuyos elemento es
cero. Demostrar que sikA = O, entonces k = O o A = O.
20. Sea I la matriz n
X
n cuyo elemento en el renglóni y en la columnaj es
Demostrar que AI = IA = A para toda matrizA n
X
n
[ u'J. ] 6 X 6 quecumplalacondiciónquese
establece. Hacer que las respuestas seanlo más generales posible usando letras en vez
de números específicos para denotarlos elementos diferentes de cero.
21. Encadainciso,encontrarunamatriz
22. Encontrar una matriz A = [ulJ de 4
X
4 cuyos elementos cumplan la condición que se
23. Demostrar lo siguiente: SiA es una matriz m
X
n, entonces
donde S es la suma de los cuadrados de
los elementos de A
24. Usando el resultado del ejercicio23, demostrar lo siguiente.
a) Si A es una matrizm X n tal q u e m T= O O ATA = O , entonces A = O.
b) Si A es una matrizn X n tal que A = AT y A2 = O, entonces A = O.
I .4 INVERSAS; REGLAS DE LA ARITMÉTICA DE MATRICES
En esta sección se analizarán algunas propiedades delas operaciones aritméticas
sobre matrices. Se verá que muchas de las reglas básicas de la aritmética de los
números reales también se cumplen para matrices, aunque unas cuantas
no.
62
,/
Sistemas de ecuaciones lineales y matrices
PROPIEDADES
DE LAS
OPERACIONES
CON MATRICES
Paranúmeros reales a y b siempre se tiene que ab = ba, lo cual se denomina ley
conmutativa de la multiplicación. Para matrices, sin embargo, A B y BA no
necesariamente son iguales. Es posible quelaigualdad nose cumpla debido a tres
razones. Puede suceder, por ejemplo, que A B esté definido pero que BA no. Este es
el caso si A es una matriz 2 x 3 y B es una matriz 3 x 4. También, puede suceder
que A B y BA estén definidos aunquesean de tamaños distintos. Esta es la
situación si A es una matriz 2 X 3 y B es una matriz 3 X 2. Finalmente, como se
muestra en el ejemplo 1, se puede tener A B f BA inclusive si tanto A B como BA4
están definidos y son del mismo tamaño.
Ejemplo 1 Considerar las matrices
Al multiplicar se obtiene
BA
=
[
-3
‘1
o
Así, A B f BA. A
Aunque la ley conmutativa de la multiplicación no es válida en aritmética
matricial, muchas leyes conocidas de la aritmética son válidas para matrices. En el
siguiente teorema se resumen algunas de las más importantes, así como sus denominaciones
Teorema 1.4.1. Suponiendo que los tamaños de las matrices son tales que las
operaciones indicadas se pueden efectuar, entonces son válidas las siguientes
reglas de aritmética matricial.
a) A + B = B + A
h) A f ( B + C ) = ( A + B ) f C
c ) A(BC) = (AB)C
d ) A(B+C)=AB+AC
e ) ( B f C ) A = BA + CA
f)A(B-C)=AB-.4C
g ) ( B - C ) A = BA -- CA
h ) a(B + C ) = aB + aC
i ) a(B - C ) = nB - aC
(Ley c o n d a t i v a de la adición)
(Ley mociativa de la adición)
(Ley asociativa de la mltiplicación)
(Ley distributiva por la izquierda)
(Ley disfributivaporla derecha)
j ) (a+b)C=uC+bC
k ) (U - b ) C = u C - bC
I ) a(hC) = (ab)C
m ) a(BC) = (aB)C= B(aC)
I
Para probar las igualdades de este teorema es necesario demostrar que
la matriz
del miembro izquierdo es del mismo tamaño que la matriz del miembro derecho y
que los elementos correspondientes en ambos miembros son iguales. Con excepción de la ley asociativa del inciso c), todas las demostraciones siguen el mismo
1.4 Inversas; reglas de la aritmética de matrices / 63
patrón general. Como ilustración, se demostrará el inciso 6). La demostración de
la ley asociativa, que es más complicada,se esboza en los ejercicios.
Demostración de d). Es necesario demostrar que A ( B + C ) y A B + AC son del
mismo tamaño y que los elementos correspondientesson iguales. Para formar A ( B
+ C), las matrices B y C deben ser del mismo tamaño, porejemplo m x n, y
entonces la matriz A debe tener m columnas, de modo que su tamaño debe ser de
la forma r x m. Con lo anterior, se tiene que A ( B + C ) es una matriz r X n. Se
concluye que A B + A C también es una matriz r X n y, en consecuencia,A ( B + C)
y A B + AC son del mismo tamaño.
los
Suponerque A = [a,], B = [bu]y C = [c,]. Se quieredemostrarque
elementos correspondientesde A(B + C ) y AB + AC son iguales; es decir, que
[A(B
+ C ) ] ,= [ A B + AC I;,
para todos los valores de i y j . Pero por las definiciones de adición y multiplicación
de matrices se tiene
[A(B + C)];,
+ + a,2(b2j+ c2,) + . . . + aim(bmj+ cm,)
= (a,,b,, + a,2b2,+ . . . + aimb,,) + ( a j l c , +
,
+ . . . + a,,cmj)
= [AB],,+ [AC,,] = [ A B + AC I,, u
= a,,(bl, cl,)
U , ~ C ~ ,
Aunque las operaciones de adición y multiplicación de matrices
se definieron para pares de matrices, las leyes asociativas 6) y c ) permiten denotar
sumas y productos de tres matrices como A + B + C y ABC sin introducir ningún
paréntesis. Lo anterior se justifica por el hechodeque sin importar cómo se
introducen paréntesis, las leyes asociativas garantizan la obtencióndelmismo
resultado final. En general, dados cualquier suma o producto de matrices, en las
expresiones se pueden introducir o eliminar pares de paréntesis sin afectar el
resultadojnal.
OBSERVACI~N.
Ejemplo 2 Como ilustración de la ley asociativa de la multiplicación de matrices,
considerar
Entonces
.
. ..
Y
1
.4(BC) = 3
O
24
1
de modo que (,dB)(' = A(B(?, como garantiza el teorema 1.4.IC. A
MATRICES
CERO
Una matrizque tiene todos sus elemento iguales a cero, como
se denomina matriz cero. Una matriz cero se denotara por O; si es importante
destacar el tamaño, se escribirá Omxn para denotar la matriz cero m x n.
Si A es cualquier matriz y U es la matriz cero del mismo tamaño que A , resulta
evidente queA + O = O + .4= A . La matriz O desempeña casi la misma función en
estas ecuaciones matriciales que la desempeñada porel número O en las ecuaciones numéricasa + O = O + a = a.
Como ya se sabe que algunas de las reglas de la aritmética para los números
reales no se cumplen en la aritmética matricial, sería temerario asumir que todas
las propiedades del número realcerose
cumplenpara las matrices cero. Por
ejemplo. considerar los dos resultados normales siguientes de la aritmética para
los nlimeros reales.
Si ab = ac y a = O. entonces b = c. (Esto se denomina ley de cancelación.)
Si ad = O entonces por lo menos uno de los factores del miembro izquierdo
es cero.
Comose muestra enel siguiente ejemplo, engeneral losresultados correspondientes no son ciertos en aritmética matricial.
Ejemplo 3 Considerar las matrices
1.4 Inversas; reglas de la aritmética de matrices / 65
Aquí
3
A B = , A C = [6
4
8]
Aunque A # O, es incorrecto cancelar la A en ambos miembros de la ecuación A B
y escribir B = C. Así, la ley de cancelación no se cumple para matrices.
También, A D = O, aunqueA # O y D # O. A
= AC
A pesar del ejemplo anterior, existen varias propiedades conocidas de número
real O que se cumplen en las matrices cero. Algunas de las más importantes se
resumen en el siguiente teorema. Las demostracionesse dejan como ejercicio.
Teorema 1.4.2. Si se supone que los tamaAos de las matrices son tales que es
posible efectuar las operaciones que se indican, las siguientesreglas de
aritmética matricial son válidas.
a)
A+U=O+A=A
6)A-A-O
O P A = -A
d ) A O = O; OA = O
C)
MATRICES
IDENTIDAD
De especial interés son las
matrices
cuadradas
que
principal y ceros fuera de ésta, como
tienen unos en la diagonal
Una matriz de esta forma se denomina matriz identidady se denota por f. Si es
importante recalcarel tamaño, se escribirá In para denotarla matriz identidad n X n .
Si A es una matriz m X n, entonces, como se ilustra en el siguiente ejemplo,
Así, en aritmética matricial la matriz identidad juega unpapel bastante semejante
al que desempeñael número 1 en las relaciones numéricas a 1 = 1 . a = a.
'
Ejemplo 4 Considerar la matriz
Entonces
66
5';ste)rra.sde ccuaciones lineales .v matrices
Como se muestra enel siguiente teorema, las matrices identidad surgen de
manera natural enel
estudio de formas escalonadas reducidas de matrices
cuadradas.
Teorema 1.43. Si I? e s la forma escalonada reducida de una tnatriz A de n
n, entonces R tiene un renglón de ceros, o bien, R es la matriz identidad ih.
Demostración.
X
Suponer que la forma escalonada reducida de A es
t-11
R = [r;,
y,, I
I';
I'IZ
r R z
' ' '
Yl?,
" '
..
"n n
Entonces sucede que el ultimo renglón de esta matriz está integrado completamente de ceros o no lo está. En caso de que no lo esté, la matriz no contiene
renglones cero y. en consecuencia, cada uno de
los n renglones contiene un
elemento principal igual a 1. Como estos unos principales aparecen progresivamentecada vez más lejos hacia la derechaamedidaquelamatrizse
recorre hacia abajo. cada uno de estos unos debe aparecer en l a diagonal principal. Ya que los demás elementos en la misma columna
de uno de los unos
principales son cero, entonces R debe ser I,,. Así, R tiene un renglón de ceros,
o bien, R = I,,. 0
INVERSA DE UNA
MATRIZ
Definición. Si A es unamatrizcuadrada
y si se puedeencontraruna
matriz B del mismo tamaño tal que AB = BA = I. entonces se dice que A es
invertible y R se denomina una inversa de A .
Ejemplo S La matriz
1.4 Inversas; reglas de la aritmética de matrices 1 67
Ejemplo 6 La matriz
no es invertible. Para ver por qué, sea
cualquier matriz 3
X
3 . La tercera columna de BA es
Así.
BA#I=
PROPIEDADES
DE LAS
INVERSAS
[a :I
O
1
O
A
Es razonable preguntar si una matriz invertible puede tener más de una inversa. El
siguiente teorema
muestra
que la respuesta es no: una matriz
invertible
tiene
exactamente una inversa.
I Teorema 1.4.4. Si B y C son, ambas, inversas de la matriz A, entonces B = C. I
Demostración. Ya que B es una inversade A , se tiene que BA = I. Al multiplicar
ambos miembros por la derecha por C se obtiene (BA)C = IC = C. Pero (BA)C =
B ( A 0 = BI = B , de modo que C = B.
u
Como una consecuencia de este importante resultado, ahora es posible hablar
de "la" inversa de una matriz invertible. Si A es invertible, entonces su inversa se
denota por el símbolo A-'. Así,
AA"=/
y
A"A-I
t
La inversa de .-1 t i e x cn aritmCtica matricial casi la misma función que cl
recíproco a.-i juega en las relaciones numericas aa-l = 1 y a-"a = 1.
En la siguiente sección se desarrollará m método para determinar inversas de
xnatriccs jnvertibles dc cualquier tamafio; sin embargo, el siguiente teorema
establece condiciones bajo las cuales una matriz 2 X 2 es invertible y proporciona
una fórmula sencilla para cncontrar l a inversa.
f
O. er? cuyo
cuso la
Inversa está definida por la
U
Ud -
Demostracidn.
bc
Se deja para el lector la comprobación de que .M " = I, y A -'A
Teorema 1.4.6. Si A y R son tnatrices invertibles del mismo tamaño, entonces
a ) A B es znverlible,
b ) (AB)" = 8",4 -1,
Demostración. Si se puede demostrar que (AB)(B"A ") = (N"'A ")(AB) = I,
entonces se habrá demostrado simultáneamente que la matriz AB es invertible y
que ( A B ) - ] = 5 " ~ " . Pero (AR)(B"A-') = A ( B B - ~ ~ "= AIA " =AA" = I.
Con un razonamiento semejante se demuestra que (B"A")(AH) = 1.
Aunque este resultado no se demostrará, se puede extender para incluir tres o
más factores: es decir.
Un producto de cualqurer número de matrices invertibles es invertible, y la
inversa del producto es el producto de las inversas en orden invertido.
Ejemplo 7 Considerar las matnces
1.4 Inversas; reglas de la aritmética de matrices / 69
Aplicando la fórmuladel Teorema 1.4.5, se obtiene
También,
Por consiguiente, ( ~ 1 3 1 - l = B"A"
POTENCIASDE
UNA MATRIZ
, como garantiza el teorema 1.4.6. A
A continuación se definirán las potenciasdeuna matriz cuadrada y se analizarán
sus propiedades.
Definición. Si A es una matriz cuadrada, entonces las potencias enteras no negativas de A se definen como
n factores
I
Además, si A es invertible, entonces laspotencias enteras negativas de A se
definen conlo
n factores
Debido a queesta definición es paralela a la de los números reales, se cumplen las
leyes usuales de los exponentes. (Se omiten los detalles.)
I
Teorema 1.4.7. Si A es una matriz cuadrada y r y S son enteros, entonces
El siguiente teorema establece algunas propiedades importantesde los exponentes negativos.
70
/
Sistemas de ecuaciones lineales y matrices
Demostración
a) C o m o A K l =d4K1A= f , 1amatrizA" esinvertibley(A")"
=A.
b ) Este inciso se deja como ejercicio.
c) Si k es cualquier escalar diferente de cero, entonces por los resultados I) y m )
del teorema 1.4.1es posible escribir
De manera semejante,
LA"
(k
Ejemplo 8 Sean A y A
"
1
(U)=Ide modo que kA es invertible y (U)" = $A-1.
' como en el ejemplo 7; es decir,
Entonces
EXPRESIONES
POLIN~MICAS
EN QUE
APARECEN
MATRICES
Si A es unamatrizcuadrada, porejemplo m
+
m, y si
+ . . + a,,s"
p ( x ) = a() a 1x
cualquier
es
X
'
polinomio,, entoncesdefine
se
+
p(A) = a,,/ a , A
+ . . . + a,,A"
donde I es la matriz identidad m X m. En palabras, p(A) es la matriz m
se obtiene cuando A se sustituye porx en (1) y a. se reemplaza por a d .
Ejemplo 9 Si
entonces
X
m que
1.3 Inversas; reglas de la aritmktica de matrices
PROPIEDADES
DE LA
71
En el siguiente teoremase enumeran las propiedadesmás importantes de la operación de transposición.
TRANSPUESTA
Teorema 1.4.9. Si los tamaños de las matrices son tales que se pueden efictuur
las operaclones planteadas, entonces
u ) ( ( A ) T ) T= A
b) ( A + B ) ~ = A ' +B r y ( A - B)'= A ' - B'
C ) ( k A ) = kA ,
' donde k es cualquier escalar
r i ) (AB)'= B ~ A T
:B-'.8.'
'
~pQ1-1
Considerando que al transponer una matriz se intercambian sus renglones y
sus columnas, los incisos a), b ) y c ) deben ser evidentes. Por ejemplo. en el inciso
a) se establece que al intercambiar renglones y columnas dos veces la matriz permanece sin modificar; en el inciso 6) se afirma que al sumar y luego intercambiar
renglones y columnas se obtiene el mismo resultado quecuandoprimero
se
intercambian renglones y columnas y luego se suma; y en el inciso c) se establece
que al multiplicar por un escalar y luego intercambiar renglonesy columnas se obtiene el mismo resultado que si primero se intercambian renglones y columnas y
luego se multiplica por un escalar. El inciso (d)no es tan evidente. por lo que se
demostrará.
Demostracidn de 6).
Sean
de modo que es posible formar los dos productos A B y BTAT. Se deja para el lector
comprobar que (AB)Ty BTAT son del mismo tamaño; a saber, que son n x m. Así,
queda por demostrar que los elementos correspondientesde (ABjTy BTAT son los
mismos; es decir,
( ( A B ) T )= (BT,4')),,
(2)
I,
AI aplicar la fórmula (S) de la sección 1.3 al miembro izquierdo de esta ecuación y
usar la definición de multiplicación de matrices, se obtiene
(('4B)') =(AB),, = u, .I b I j
,,
+
+ . . . + u,?h,.,
(3)
Para evaluar el miembro derecho de (2) es conveniente queatíjy b', denoten los ijésimos elementosde A7 y BT. respectivamente, de modo que
I2
,/
Sistemas de ecuaciones lineales y matrices
Lo anterior, junto con (3), demuestra (2).
0
Aunque nose demostrara este hecho, el inciso 6) del teorema se puede
extender para incluir tres o más factores; es decir,
I
La transpuesta de un producto de cualquier número de matrices
producto de sus transpuestas en orden invertido.
es igual al
Nótese la semejanza entre este resultado y el resultado, que está
a continuación del teorema 1.4.6, respecto a la inversa de un producto dematrices.
OBSERVACI~N.
INVERTIBILIDAD
DE UNA
TRANSPUESTA
El siguiente teorema establece una relación entre lainversadeunamatriz
vertible y inversa
la de
su transpuesta.
1 Teorema 1.4.10.
Demostración.
demostrar que
Si A es una matriz invertible, entonces AT también es inver-
Se
puede
I
probar la invertibilidad de AT y obtener (4) al
A7'(.+-l)T=(.+-*)TAT=]
Pero por el inciso d)del teorema 1.4.9y el hecho de queIT = Z, se tiene
con lo que se completa la demostración. 11
Ejemplo 10
in-
Considerar las matrices
Al aplicar el teorema 1.4.5 se obtiene
. *'.
.,a
,
1.4 Inversas; reglas de la aritmética de matrices
/
Como garantiza el teorema 1.4.10, estas matrices satisfacen la fórmula (4). A
EJERClCIOS DE LA SECCIóN 1.4
1. Sean
2
A=[-;
;
-1
i],
-;
-3
B=[:
-
a],
o
-2
C=[:
t],
3
u=4,
Demostrar que
+
(B + C )= ( A + B )
d) u(B - C ) UB - UC
a) A
+- C
b) (AB)C= A ( B C )
c)
(U
+ h)C = UC + bC
2. Usando las matricesy los escalares del ejercicio I , demostrar que
a) a(BC) = (uB)C= B(uC)
b) A ( B - C ) = AB - AC
C)
(B+ C)A = EA
+ CA
d) u(bC) = (ub)C
3. Usando las matrices y los escalares del ejercicio 1, demostrar que
a)
A
b) ( A + B ) 7 = A r + B T
c) ( U C ) ~ = U C ~d) ( A B ) 7 = B 7 A 7
4. Usar el teorema 1.4.5 para calcular las inversas de las sguientes matrices
5. Comprobar que las tres matrices A , B y C del ejercicio 4 satisfacen las relaciones
(AB)" = B"A"
y (fit)" = C"B"A"
6. Sean A y B matricescuadradasdelmismotamaño.
tricial válida? Justificar la respuesta
7. En cada inciso, usar la información dada para encontrarA .
/
8. SeaA la matriz
[:Y]
Calcular A3, A-3 y A' - 2A + I.
1 9 . Sea A la matriz
[: :I
= A2B2 es unaigualdad ma-
h = -7
73
74 í Sistemas de ecuaciones linealesy matrices
224526
En cada inciso, determinarp(A).
b) p ( x ) = 2x2 -x + 1
a) p ( x ) = x -2
c) p ( x ) = x3 -2x + 4
10. Seanpl(x) =x2 - 9,p,(x) = x + 3 y p , ( x ) = x - 3 .
a) Demostrar quep , ( A ) =p,(Alp,(A) para la matrizA del ejercicio9.
b) Demostrar quep , ( A )= p,(A)p,(A) para cualquier matriz cuadradaA
./11. Encontrar la inversa de
r
--en
cos*0
cos 0
12. a) Encontrar matnces A y B 2 X 2 tales que (A + B)' # A2 + 2AB + B2.
b) Demostrar que si'4 y B son matrices cuadradas tales queAB = BA, entonces
('4
+ B)2 = A
' + 2ilB + B'
c) Encontrar un desarrollo de ( A + B)' que sea válido para todas las matrices cuadradas A y B del mismo tamaño.
'" "7 y
13. Considerar la matriz
o
.4 =
o
donde a ,la22-
. .
o
o
" '
"
.
'
'
'
ann
annf O. Demostrar que'1 es invertible y encontrar su inversa
14. Demostrar que si una matriz cuadrada A satisface ,43 - 311 + I = O, entonces A"
- A.
=
31
15. a) Demostrar que una matnzcon un renglón de ceros no puede tener inversa.
b) Demostrar que una matrizcon una columna de cerosno puede tener inversa.
16. La suma de dos matrices invertibles, ¿necesariamente es invertible?
17. Sean A y B matrices cuadradas tales que
entonces B = O.
AB = O. Demostrar que si A es invertible,
18. En el teorema 1.4.2, ¿por qué el incisod) no se escribió comoAO = O = OA?
19. La ecuación real a' = 1 tiene exactamente dos soluciones. Encontrar por lo menos ocho
matricesdiferentes 3 X 3 que cumplan la ecuaciónmatricial A2 = I,. [Sugerencia
Buscar soluciones en las que todos los elementos fuera de la diagonal principal sean
iguales a cero.]
20. a) Encontrar una matnz A 3
b) Encontrar una matrizA 3
X
X
3 diferente de cero tal que A T = A.
3 diferente de cero tal queAT = -A.
21. Una matriz cuadrada A se denomina simétrica si A T = A y antisimétrica es AT = -A
Demostrar que si B es una matriz cuadrada, entonces
a) B B y~B + B~ son simétricas.b)
B - BT esantisimétrica.
22. Si A es una matriz cuadrada y n es un entero positivo, ¿,es cierto que (A")T = (A')"?
Justificar la respuesta.
23. Sea A la matriz
Determinar si A es invertible y, en caso afirmativo, encontrar su inversa. ISugerencia
Resolver AX = I igualando los elementos correspondientes de ambos miembros.]
24. Demostrar lo siguiente:
a) Inciso b ) del teorema 1.4. l . b) Inciso i) del teorema 1.4. l .
ma 1.4.1.
c) Inciso m ) del teore-
25. Aplicar los incisos d)y m) del teorema 1.4.1 a las matrices A , B y (- 1)(' para obtener
el resultado del incison.
26. Demostrar el teorema 1.4.2
27. Considerar las leyes de los exponentesArAS= A r f S y (A')" = A"".
a) Demostrar que si .4 es cualquier matriz cuadrada, entonces estas leyes son váliGas
para todos los valores enteros no negativos de
r y s.
b) Demostrar que si A es invertible, entonces estas leyes son válidas para todos
los
valores enteros negativos der y s.
28. Demostrar que si A es invertible y k es cualquier escalar diferente de cero, entonces
(M)"= PA" para todos los valores enteros den.
29. a) Demostrar que SI ,4 es invertible y AB = AC, entonces B = C.
b) Explicar por quC el inciso a) y el ejemplo 3 no se contradicen entre sí.
I
30. Demostrar el inciso c) del teorema 1.4. l . [Sugerencia Suponer que A es m X n, que B
es n X p y que C es p X q. El 9-ésimo elemento en el miembro izquierdo es 111 = all
BC + u12BC + . + alnBC y el q-ésimo elemento en el miembro derecho es r
11
= ~ ~ l ~ , ~ + i l B ~ z c ~ + .Comprobarque1
~ . . + A B ~ r =r 1
'
'
~,,
P PJ
u
11
1.5 MATRICES ELEMENTALES Y UN MÉTODO PARA DETERMINAR A-'
En estasección se obtendrá un algoritmo para determinar la inversa de una
matriz invertible y se analizarán algunas propiedades básicas de las matrices invertibles.
76 / Sistemas de ecuaciones linealesy matrices
MATRICES
ELEMENTALES
Definición. Una matriz 11 X n se denomina matriz elemental si se puede obtener
a partir de la matriz identidad In n X n al efectuar una sola operación elemental
en los renglones.
[;
Ejemplo 1 A continuación se muestran cuatro matrices elementales y las operaciones con que se obtuvieron.
O 0 1 0
] F I E ]
Sumar 3 veces el tercerMultiplicar
- 3 el segundo
renglones
segundo
y
renglón de /?
por
Cuando una matrizA se multiplica por la izquierda por una matriz elemental E,
el efecto es efectuar una operación elemental enlos renglones deA . Este es el contenido
del siguiente teorema, cuya demostración se deja
corno ejercicio para el lector.
Teorema 1.5.1. S i la matriz elemental E resulta de la ejecución de ciertas
operaciones en los renglones de I,,, y si A es una matriz m x n, entonces e l
producto EA es la matriz que se obtiene cuando la misma operación en los
renglones se efectúa en .1.
Ejemplo 2 Considerar la matriz
1
A=[2
1
0
2
-1
3
4
4
y considerar la matriz elemental
1
0
0
3
o
1
que resulta al sumar 3 veces el primer renglón deI3al tercero. El producto E4 es
EA=
I
1
2
0
-1
4
4
1
0
9
1.5 Matrices elementules,v un método pura determinar A”
/ 77
que es precisamente la misma matriz que se obtiene al sumar 3 veces el primer
renglón de A al tercer renglón. A
Si una operación elemental en los renglones se ejecuta en una matriz elemental I para obtener una matriz elemental E, entonces existe una segunda operación en los renglones que, al ser efectuada en E, produce nuevamente I. Por
ejemplo, si E se obtiene al multiplicar el i-ésimo renglón de I por una constante c
diferente de cero, entonces I se puede recuperar si el i-ésimo renglón de E se multiplica por llc. En la tabla l se enumeran las diversas posibilidades.
TABLA 1
Operaciones en los renglones
de E que reproducen I
Operaciones en los renglones
de Z que producen E
Multiplicar el renglón i por c
f
O
Intercambiar los renglones i y J
Multiplicar el renglón i por 1/c
Intercambiar los renglones i y j
Las operaciones en la columna derecha de la tabla se denominan operaciones
inversas de las operaciones correspondientes en la columna izquierda.
Ejemplo 3 En cada una de las siguientes situaciones se efectuó una operación
elemental en un renglón de la matriz identidad 2 X 2 para obtener una matriz elemental E, y luego E se convirtió en la matriz identidad mediante la operación
inversa en el mismo renglón.
[:Y]
Multiplicar por 7 el segun-
[t
:]
I
Multiplicar por 1/7 el
renglón.
gundo
[Y A]
se-
I
78
Sistemas de ecuaciones lineales v matrices
prlmero Y segundo.
[:, :I
[::]
-+
[:P]
I
"
Sumar -5 veces el segundo renglón al primero.
El siguiente teorema establece una propiedad importantede las matrices elementales.
Teorema 1.5.2. Toda matriz elemental es invertible, y la inversa también
una matriz elemental.
es
Demosfración. Si E es una matriz elemental, entonces E se obtiene al efectuar
algunas operaciones en los renglones de I. Sea E, la matriz que se obtiene cuando
la inversa de esta operacion se efectúa en I. Al aplicar el teorema 1.5.1 y usando el
hecho de que las operaciones inversas en los renglones cancelan mutuamente su
efecto, se concluye que
E,E= I
y
Así. la matriz elemental E, es la inversa de E.
EE,=I
0
El siguiente teoremaestablece algunas relaciones fundamentales entre invertibilidad, sistemas lineales homogéneos, formas escalonadas reducidas ymatrices elementales. Estos resultados son extremadamenteimportantes y se usarán
muchas veces en secciones ultenores.
Teorema 1.5.3. Si A es una matriz n X n, entonces las siguientes proposiciones
son equivalentes; es decir, todas son verdaderas o todas son falsas.
a) A es Invertible.
b ) Ax = O sólo tiene la solución trivial.
c ) La.forma escalonada reducida de A es In.
d)A se puede expresar como un producto de matrices elementales.
Demostración. Se demostrará la equivalencia estableciendo la cadena de
implicaciones a * b * c => d * a.
a
* b: Suponer queA es invertible y sea x(,
= O.
cualquier solución de A x = O; así, Axo
Al multiplicar ambos miembros de esta ecuación por la matriz A" se obtiene
1.5Matrices elementalesy un método para determinar A-'
= A"O, o (A"A)% = O , o Ix,
tiene la solución trivial.
b
=
/ 79
O, o x, = O. Por tanto, Axo = O sólo
* c: Sea Ax = O la forma matricial del sistema
+ a 1 2 x 2+ ' . + a , , x , = o
a 2 1 x I+ u22x2+ . . . + u 2 , x , = o
allXl
'
+ an2x2 + . + annx, = o
UnlXl
' '
y suponer que el sistema sólo tiene la solución trivial. Si el sistema se resuelve por
eliminación de Gauss-Jordan, entoncesel sistema de ecuaciones correspondiente a
la forma escalonadareducida de la matriz aumentadaes
=o
=o
*I
x2
x,
=
o
Así, la matriz aumentada
..
de (1) se puede reducir a la matriz aumentada
1
o o
0 0 0 . " 1
o
de (2) por medio de una sucesión de operaciones elementales en los renglones. Si
en cada una de estas matrices se elimina la última columna (de ceros), se puede
concluir que la forma escalonada reducidade A es I,.
c * d: Suponer que la forma escalonada reducida de A es I,, de modo que A se
puede reducir a Z, mediante una sucesión finita de operaciones elementales enlos
renglones. Por el teorema 1.5.1, cada una de las operaciones se puedeefectuar
80
Sistemasdeecuaciones 1ineales.v matrices
multiplicando por la izquierda por una matriz elemental idónea. Así. es posible
hallar matrices elementalesE,, E2, . . . , Ek tales que
F> h . , . F'2 E I ''1 - 1
I,
(3)
Por el teorema 1.5.2. las matriccs elementales E,, E*.. .. ; , Ek son invertibles. Al
multiplicar por la izquierda ambos miembros de la ecuaclon (3) sucesivamente por
E;l
I?;, P" se obtiene
I
.
.
.l
.
,
,d
= E,- 'E? l .
. .E, ¡I,,= E , ' E 2 I . . .EA
Por el teorema1.5.2, csta ecuación expresa .4 comoun
elementales.
(4)
productodematrices
d * a: Si il es un producto de matrices elementales, entonces por los teoremas
1.4.6 y 1.5.2 la matriz '4 es un producto de matrices invertibles, y por tanto es
invertible. 0
EQUIVALENCLA
POR
RENGLONES
Si una matriz B se puede obtener a partir de una matriz A mediante la ejecución
de una
sucesión
finita de operaciones
elementales
en
los renglones, entonces
resulta evidente que 13 sepuede convertir denuevo en A mediantela ejecuciónal
revésde las inversas de tales operacioneselementalesen
los renglones. Las
matrices que se pueden obtener a partir de otra matriz mediante la ejecución de
unasucesión finita de operacioneselementalesen los renglones se denominan
equivalentes por rengfones. Con esta terminología, por los incisos a) y c ) del
teorema 1.5.3 se concluyequeuna matriz A n X n es invertible si y sólo si es
equivalente por renglones a la matriz identidad n X n
U N MÉTODO
Como primera aplicación del teorema1.5.3,se establecerá unmétodo para determinar la inversa de una matriz invertible. Al invertir los miembros izquierdo y derechode (4) seobtiene A" = EL E2 E,o, de manera equivalente,
PARA INVERTIR
MATRICES
'
'
que establece que A - sepuede obtener al multiplicar I, sucesivamente por la
izquierda por las matrices elementales E,, E2, . . . , Ek. Como cada multiplicación
por la izquierda por una de estas matrices elementalesefectúa una operación enlos
renglones, al comparar las ecuaciones (3) y (5) seconcluye que la sucesión de
operaciones en los renglones que reduce A a I, también reduce I, a A". Así. se
tiene el siguiente resultado:
L
Para determinar la inversa de una matriz invertible A , es necesario encontrar
una sucesión de operaciones elementales en los renglones que reduzca A a la
matriz identidad y luego efectuar esta misma sucesión de operaciones en I ,
para obtener A".
En el siguiente ejemplo se proporciona un método sencillo para llevar a cabo el
procedimiento anterior.
1.5 Matrices elementalesy un método para determinar A"
/ 81
Ejemplo 4 Encontrar la inversade
Solución. Se desea reducir A a la matriz identidad mediante operaciones en los
renglones y aplicar simultáneamente las operaciones a I para obtener A - l . Para
lograr ésto, la matriz identidad se adjunta a la derecha de A , con lo que se obtiene
una matriz dela forma
y luego se aplican operaciones en los renglones a esta matriz hasta que el lado
izquierdo se reduce a I; estas operaciones convierten el lado derecho en A", de
modo que la matrizfinal es de la forma
[I
A"]
Los cálculos son como sigue:
1
2
1
2
5
0
3
3
8
/
j
j
1
0
O
0
1
O
2
3
1
1
o 1 - 3 1 -2
0 - 25 ; - 1
0
1
1
1
o
o
2
3
1 1
1 - 3 :
-2
1
2
3
1
O
2
1
O j -14
1 3 - 5
0 :
1
o
0
1
j
0
"1
"1 I
1
Se sumó -2 veces el primer
renglón al segundo y - el
1 vez
1
primer renglón al tercero.
1
1
0
Se sumó 3 veces el tercer renglón
al segundo y -3 veces el tercer
Se sumó -2 veces el segundo
82 !Sistemas de ecuaciones lineales y matrices
Así,
A menudo no es posible saber de antemano si una matriz dada es invertible.
Si una matriz A n X n no es invertible, entonces nosepuede reducir a I,, por
medio de operaciones elementales en los renglones [inciso ( c ) del teorema 1.5.3.1
Planteado de otra forma, la forma escalonadareducida de A contiene por lo menos
un renglón de ceros. Así, si el procedimiento del último ejemplo se intenta con una
matriz que no es invertible, entonces en algún momento de los cálculos aparecerá
un renglón de ceros enel lado izquierdo. Entonces es posible concluir que la
matriz dada no es invertible, de modo que ya no se realizan más cálculos.
Ejemplo 5 Considerar la matriz
6
1
2
A = [
4
2
-1
4-
-1
5-
Al aplicar el procedimiento del ejemplo 4 se obtiene
1
6
2
4
-1
2
1
6
4
o -8
-9
[-
0
8
o
o
-- 1 ;
1
'
54 1!
1
oo
1
I
9
I
-2
I
1
1
0
1
0
'"I
1
renglón al segundo y se sumó el
1
:undo renglón
tercero.
Dado que enel lado izquierdo se ha obtenido un renglónde ceros, se concluye que
A no es invertible. A
Ejemplo 6 En el ejemplo 4 se demostró que
es una matriz invertible. Por el tepema 1.5.3 se concluye que el sistema de ecuaciones
1.5 Matrices elementales y un método para determinar A"
+ 2x, + 3x, = o
2x, + 5x, + 3x, = o
x,
+ 8x,
XI
=O
sólo tiene la solución trivial. A
EJERCICIOS DE LA SECCIÓN 1.5
1. De las siguientes matrices, ¿cuáles son elementales'?
2.
3.
Encontrar una operación en los renglones que convierta la matriz elemental
-: -:I,
Considerar las matrices
3
A=[&
8
4
B=[:
-:-:I,
1
dada en
4
5
c=[i
1;
-i]
Encontrar matrices elementalesE,, E2,E, y E4tales que
a) E , A = B b) E $ = A c)E#=C d)E4C=A
4. En el ejercicio 3, Les posible encontrar una matriz elemental E tal que EB = C? JUS-
tificar la respuesta.
En los ejercicios 5. 6 y 7, aplicar el método mostrado en los ejemplos 4 y 5 para encontrar
lainversadelamatriz
dada silamatnzesinvertible,
y comprobar la respuestapor
multiplicación.
/ 83
d)
[-: 'i
.. .
1-3
L')
4
7
[
o1
o
2
-
o
o2
(1!
I
3
o
I
5
"3.
8. Encontrar la inversa de cada una dc las siguientes
matrices 4 X 4, donde k,, k2,k3, k4 y
k son, todos, diferentes de cero.
9. Considerar la matriz
a) Encontrar matrices elementalesE , y E, tales que E P , A = I.
b) Escrihir A - como un producto de dosmatrices elementales.
c) Escribir <4como un producto de dos matnces elementales.
'
10. En cada inciso, efectuar en
la operación en los renglones que se indica, multiplicando A por la izquierda por una
matnz elemental. En cada caso, comprobar l a respuesta, efectuando la operación en los
renglones directamente enA.
a) Intercambiar los renglones primeroy tercero.
b) Multiplicar por f el segundo renglón.
c) Sumar dos veces el segundo renglón al primer renglón.
11. Expresar la matriz
en la forma A = EFGR, donde E, F y G son matrices elementales y R está en forma
escalonada.
12. Demostrar que si
es una matriz elemental, entonces por lo menos un elemento en el tercer renglón debe
ser igual a cero.
1.6 Otros resultados sobre sistemas e invertibilidad
r
I’
85
13. Demostrar que
O
a
O
O
O
b O c O O
A = O d O e O
O O f O , q
o O o I? o,
no es invertible para cualesquiera valores de los elementos
14. Demostrar que si A es una matriz m X n, entonces existe una matriz invertible
C tal
que CA está en forma escalonada reducida.
y B es equivalente por renglones a
15. Demostrar que si A es una matriz invertible
A,
entonces B también es invertible.
16. a) Demostrar: Si A y B son matrices m X n, entonces A y B son equivalentes por
renglones si y sólo si A y B tienen la mismaforma escalonada reducida.
b) Demostrar que A y B son equivalente por renglones, y encontrar una sucesión de
operaciones elementales en los renglones que produzca
B a partir de ‘4.
.=II ; ;] .-[I ; -;I
1
2
3
O
17. Demostrar el teorema 1.5.1
1.6 OTROS RESULTADOS SOBRE SISTEMAS DE ECUACIONES E
INVERTIBILIDAD
En estasección se estableceránmásresultados sobre sistemas de ecuaciones
lineales e invertibilidad de matrices. El trabajo dará por resultado un método
totalmente nuevo para resolver sistemas de n ecuaciones con n Incógnitas.
UN TEOREMA
FUNDAMENTAL
Se empezará por demostrarun resultado fundamental sobre sistemas lineales. que
ya fue anticipado en la primera sección de este libro.
Teorema 1.6.1. Todo sistema de ecuaciones lineales no tiene solución, tiene
exactamente una solucibn o tiene infinidad de soluciones.
~
Demostración.
~~
~~~
Si Ax = b es un sistema de ecuaciones lineales, entonces exactamente una de las siguientes afirmacicmes es vcrdadcra: a) el sisienla no tiene s c h ción, b) el sistema tiene exactamentc I ~ I I solucltr!.
;~
o bien, c) el sistema tiene más
de una solucicin.La demostración cstard conipleri si se puede demostrar que cl
sistema tiene iníínidnd de soluciones en el caso 2).
86
1'
Sistemas de ecuaciones lineales y matrices
Suponer queAx = b tiene más de una solución, y sea x. = xl - 5 ,donde x1
y &r son dos soluciones distintas cualesquiera. Debido a que x1 y 5 son dlstintas,
entonces la matriz x. es diferente de cero; además,
AX,
A(x, - X,) = A X , - AX, = b - b = O
Si ahora se deja que k sea cualquier escalar, entonces
A(x,
+ kx,) = Ax, + @x,)
=Ax,
=b+kO=b+O=b
+ k(AX,)
Pero esto establece que x, + kKo es una solución de Ax = b. Como x. es diferente
de cero y existen intinidad de elecciones para k, entonces el sistema Ax = b tiene
infinidad de soluciones. 1
RESOLUCI~NDE
SISTEMAS
LINEALES POR
INVERSI~NDE
MATRICES
Hasta el momento se han estudiado dos métodos para resolver sistemas lineales: la
eliminacióngaussiana y la eliminación de Gauss-Jordan. El siguiente teorema
proporciona unnuevo método para resolver ciertos sistemas lineales.
Teorema 1.6.2. Si A es una matriz invertible n x n, entonces para toda matriz
b n x I , el sistema de ecuaciones Ax = b tiene exactamente una solución; a
saber, x = A"b.
Demostracidn. Como A(A"b) = b, se concluye que x = A-lb es una solución
de Ax = b. Para demostrar queesta es la única solución, se supondrá que x. es una
solución arbitraria y luego se demostrará quex. debe ser la so1uciÓnA"b.
Si x. escualquier solución, entonces AxO = b. Al multiplicar ambos
miembros por A" se obtiene x. = A"b. 0
Ejemplo 1 Considerar el sistema de ecuacioneslineales
+ 2x, + 3x, = 5
2x, + sx, + 3x, = 3
XI
+ 8x3= 17
x,
En forma matricial, este sistema se puede escribir como Ax = b, donde
En el ejemplo 4 de la sección precedente se demostró queA es invertible y que
1.6 Otros resultados sobre sistemas e invertibilidad / 87
Por el teorema 1.6.2, la solución del sistema es
o bien, x1 = 1, x2 = -1,
x3 = 2.
A
OBSERVACI~N. Nótese que el métododeejemplo
1 es aplicable sólo cuando el
sistema tiene tantas ecuaciones como incógnitas y la matriz de coeficientes es invertible.
RESOLUCIóN DE
VARIOS
SISTEMAS
LINEALES CON
UNAMATRIZ DE
COEFICIENTES
Frecuentemente es necesario resolver una sucesión de sistemas
. . . , Ax=bk
AAxA
x==
xb=
b, ,b
2,,
cada uno de los cuales tiene la misma matriz de coeficientes A . Si A es invertible,
entonces las soluciones
COMÚN
. . . , xk=A-lb,
x l = A " bxl ,2 = A " b 2x ,3 = A P 1 b 3 ,
se pueden obtener con una inversión matricial y k multiplicaciones de matrices.
Sin embargo,un método más eficaz es formar la matriz
[.4 I b, I b,
...
bk]
(1)
donde la matriz de coeficientes A es "aumentada" por todas las k matrices b,, b,, .
. . , b,. Al expresar (1) en forma escalonada reducida, por eliminación de GaussJordan se puedenresolvera la veztodos los k sistemas. Este método tiene la
ventaja de que se puede aplicar aun cuandoA no sea invertible.
Ejemplo 2 Resolver los sistemas
Solución. Los dos sistemas tienen la misma matriz de Coeficientes. Si esta matriz
de coeficientes se aumenta con las columnas de constantesque están enlos
miembros derechos detales sistemas, se obtiene
88 i Sistemas de ecuaciones linealesy matrices
'1
Al expresar esta matriz en forma escalonada reducida
se obtiene (comprobar)
o
o
o
1
o
O I
1 ;
0 ;
1 I
0 ;l
1 i-1
Con base ena
l
sdos últimas columnas, se concluye que la solución del sistema a) es x,
x3 = 1, y que solución del sistema b) es x1 = 2, x2 = I y x3 = - 1. A
= 1, x2 = O,
PROPIEDADES
DE LAS
MATRICES
INVERTIBLES
A n x n es invertible ha sido
Hasta el momento, parademostrarqueunamatriz
necesario
encontrar
una
matriz
B n x n tal que
AB=/
y
BA=I
El siguente teorema demuestra quesi se obtiene una matriz B n X n que satisface
cualquier condición, entonces laotra condición se cumple automáticamente.
Teorema 1.6.3. Sea A una matriz cuadrada.
a ) ,Si B es una matriz cuadrada quesatisface BA = I, entonces B =A".
b) Si B esuna matriz cuadrada que satisface
A B = I, entonces B =A".
Se demostraráel inciso a), y el inciso 6) se deja como ejercicio.
Demostración u). Suponer que BA = I. Si es posible probar que A es invertible, la demostración se puede completar multiplicandoBA = I en ambos miembros
por A para obtener
-'
BAA"=IA"
o
BI=IA-'
O
B-A-'
Para probar queA es invertible, basta demostrar queel sistema A x = O sólo tiene la
solución trivial (véase el teorema 1.5.3). Sea x. cualquier solución de este sistema.
Si ambos miembros de AxO = O se multiplican por la izquierda por B, se obtiene
BAxo = BO o Ixo = O o x. = O . Así, el sistema de ecuaciones A x = O sólo tiene la
solución trivial. 5
Ahora ya es posible añadir dos proposicionesmás que son equivalentes a las
cuatro dadas enel teorema I . S . 3 .
~
~~
--
Teorema 1.6.4. Si A es una matriz n X n, entonces las siguientes proposiciones
son equivalentes.
a ) A es invertible.
6) A x = O sólo tiene la solución trivial.
c ) La formaescalonada reducida de A es I,,.
d) A es expresable como un producto de matrices elementales.
e ) A x = b es consistente para toda matrizb n X 1.
A x = b tiene exactamente una solución para toda matrizb n X 1.
1.6 Otros resultados sobre sistemas e invertibilidad
/ 89
Demostraciótz. Como en el teorema 1.5.3 se demostróque a), b), c) y d) son
equivalentes, basta demostrar quea * f * e * a.
a * J Este hecho ya se demostró enel teorema 1.6.2.
* e : Esta implicación es de por sí evidente. Si A x = b tiene exactamente una
solución para toda matriz b de n X 1, entonces Ax = b es consistente para toda
matriz b den X 1.
f
e * a: Si el sistema A x
particular los sistemas
=
b es consistente para toda matriz b n x 1, entonces en
son consistentes. Sean x,, 3,. . . , x,, las soluciones de los sistemas respectivos, y
se forma una matriz C n x n que tenga estas soluciones como columnas. Así, C es
de la forma
Como se analizó en la sección 1.3, las columnas sucesivas del producto A C son
A x , , Ax,, . . . , Axn
Asi,
Por el inciso b) del teorema 1.6.3 se concluye que C
invertible. 0
= A-l.
Entonces, A es
Por el trabajo realizado antes se sabe que factores de matrices invertibles
producen un producto invertible. En el siguiente teorema se considera la conversa:
se demuestra que si el producto de matrices cuadradas es invertible, entonces los
factores mismos deben ser invertibles.
90
Sistemas de ecuaciones lineales y matrices
Teorema 1.6.5. Sean A y B matrices cuadradas del mismo tamaño. Si A B es
invertible, entonces A y B también deben ser invertibles.
Más tarde se encontrará que el siguiente problema fundamental aparece en
varios contextos.
Un problema fundamental. Sea A una matriz fija m X n. Encontrar todas las
matrices b m X 1 tales que el sistema de ecuacionesAx = b sea consistente.
Si A es una matriz invertible, el teorema 1.6.2 resuelve por completo este
problema al establecer que para toda matriz b m x 1 el sistema lineal Ax = b tiene
la solución única x = A"b. Si A no es cuadrada, o si A es cuadrada pero no
invertible, entonces el teorema 1.6.2 no es válido. En estos casos la matriz b debe
satisfacer ciertas condiciones a fin de que Ax = b sea consistente. El siguiente
ejemplo ilustra cómo se puede usar la eliminacion gaussiana para determinartales
condiciones.
Ejemplo 3 ¿Qué*condlcionesdeben satisfacer b,, 6, y 6 , para que el sistema de
ecuaciones
xl + .y2 + 2x, = h ,
.xl
3- x3 = b,
2 x , + x2 + 3x, = h,
sea consistente?
Solución. La matriz aumentada es
que se puede expresar en forma escalonada reducida
como sigue.
1
1
o
-1
O
-1
[(!I
O
1
o
O
2
-1
-1
bl
h,-2h,
hl
-I
-1
1
1
O
1
1
O
Se sumó - 1 veces el primer
renglón al segundo y se sumó -2
h3-2bl
bl-b2
b2
b3-bZ-bl
veces el primer renglón al tercero.
] T
El segundo renglón se
multiplicó por - l .
El segundo renglón se
sumó al tercero.
I
1.6 Otros resultados sobre sistemas e invertibilidad / 91
Por el tercer renglón de la matriz, ahora resulta evidente que el sistema tiene una
solución si y sólo si b,, b, y b, satisfacen la condición
Expresado de otra forma, esta condición es: A x
una matriz de la forma
=b
es consistente si y sólo si b es
donde b , y b, son arbitrarios. A
Ejemplo 4 ¿Qué condiciones deben satisfacer b,, b, y b, para que el sistema de
ecuaciones
sea consistente?
Solución.
La matriz aumentada es
Al expresar esta matriz en forma escalonada reducida
se obtiene (comprobar)
1
O
O
O
1
0
O
O
1
-40b, + 16b2 + 96,
13b, - 5b2 - 3b3
5b, - 2b2 - b3
1
En este caso no hay restricciones sobre b b, y 6,; es decir, el sistema Ax = b dado
tiene la solución única
X, =
-40b,
+ 16b2 + 963,
X*
=
13b, - 5bz - 3b3, x3 = 5bl - 2 b l - b3
(3)
para toda b. A
OBSERVACI~N. Debido a que el sistema A x = b del ejemplo anterior es consistente para toda b, entonces por el teorema 1.6.4 se concluye que A es invertible. Se
deja para el lector comprobar que las fórmulas en (3) también se pueden obtener
calculando x =A"b.
92 1 Sistemas de ecuaciones linealesy matrices
EJERCICIOS DE LA SECCIóN 1.6
Y
1 al X, resolver el sistemainvirtiendolamatrizdecoeficientes
aplicando el teorema 1.6.2.
1. x,
,Y2 = 2
2. 4x, - 3.x2 = - 3
3. x, + 3x, +.u3 = 4
Sx,+ 6x2 = 9
2x, - 5x2 = 9
21, 2x2 + x3 = - 1
Zx,
3n2 + .Yi = 3
4. 5x, + 3.Y2 + 2.17 = 4
5.
.I + j' + 2 = 5
6.
- 1- - 2.v - 3 - = o
3 s , + 31, -i- ?.\Y3 = 2
.x t j'- 4; = 10
LC
Y + 4j, + 42 = 7
+ .Y2 = S
-4x+j.+
z- o
M' t 3.r
7y + 93 = 4
l b 10s ejerciciosdel
+
+
+
+
x
,
l. 3.r, + Sx, = h ,
Y , + 2x2 = h,
N.
- M' -
h,
.I
+
21 - 4y
"
63 = 0
21: t is, =
2.u, + 5.r, + Sx3 = h,
3x, + 5x, + 8x, = h,
.YI f
lisando las formulas resultantes, encontrar la soluciónsi
a ) h , = - - ~ I h, 2 = 3 . h , - 4
h) h , = S ,
h,=O,
/),=O
c) h , = - 1 .
h,= - 1 ,
10. Resolver los tres sistemas del ejercicio9 aplicando elmétodo del ejemplo 2
En los ejercicios del I 1 al 14, usar el método del ejemplo 2 para resolver simultáneamente los sistemas en todoslos incisos.
a) h, = I ,
hZ=4
h, = 5
-2,
b) h ,
Í'X,
13. 4 . ~ ~-,
= h,
.x, 2 s , = h,
+
a) h , = O, h, = 1
b) h , = -4, h, 6
h, = 3
C) h , = - I ,
d ) h , = -5, h, = I
15. Elmétododelejemplo
2 se puede usar pararesolversistemaslineales
quetienen
infinidad de soluciones. Usandoese método, resolver al mismo tiempo los sistemas de
ambos incisos.
a)
x , - Zx, +
.xi = - 2
+ -Ti =
3x, - ?x, + 2.Y, =
2x, - sx,
1
-1
+
b) xi - 2x,
=
2x, - 5x2
x; =
3xi - 7,r2 + 2x7 =
+
-
1
1
o
h,=3
1.6 Otros resultados sobre sistemas e invertibilidad / 93
En los ejercicios del 16 al 19, encontrar condiciones que deben satisfacer las b para que el
sistema sea consistente.
16. 6 ~-, 4x2 = h,
3x, - 2x2 = h,
X, -
18.
-4x,
- 4x,
2~2-
S,
+ 5x2 + 2x3
+ 7x2 + 4x3 = h,
b2
20. Considerar las matrices
a) Demostrar que la ecuación A x = x se puede volver a escribir como ( A
usar este resultado para resolverAx = x para x.
b) Resolver A x = 4x.
- I)x
=Oy
21. Resolver la siguiente ecuación matricial paraX .
22. En cada inciso, determinar si el sistema homogéneo tiene una solución no
usar lápiz y papel); luego, establecer si la matrizdada es invertible.
a)
2x, + x2 - 3x, + x4 = O
2
1 -3
5x2 + 4x, + 3x4 = o
o
5
4
3
trivial (sin
'1
b)
5x, +x,
+ 4x3 +
x4 = O
2x, -- x4 = o
x, + x4 = o
7x4 = o
O
1
4
0
0
7
23. Sea Ax = O un sistema homogéneo de n ecuaciones lineales en n incógmtas que sólo
tiene la solución tnvial. Demostrar que si k es cualquier entero positivo, entonces el
sistema Akx = O también tiene sólo lasolución trivial.
24. Sean A x = O un sistema homogéneo de n ecuaciones lineales con n incógnitas y Q una
matriz invertible n x n. Demostrar que Ax = O tiene sólo la solución trivial si y sólo si
(QA)x = O sólo tiene la solución tnvial.
25. Sea Ax = b cualquier sistema de ecuaciones lineales consistente, y sea x, una solución
fija. Demostrar que toda solución del sistema
se puede escribir en la formax = x1 + xo,
donde x. es una solución de Ax = O. También demostrar que toda matriz de estaforma
es una solución.
26. Usar el incisoa) del teorema 1.6.3 para demostrar el incisob )
94
,'
Sistemas de ecuaciones Einealesy matrices
I.7 MATRICES DIAGONALES,TRIANGULARESY SIMÉTRICAS
En estasección se considerarán ciertas clases de matrices
quetienen formas
especiales. Las matrices que se estudiarán en esta sección se encuentran entre las
más importantes del álgebra lineal y se presentan en muchas situaciones a lo
largo de este texto.
MATRICES
DUGONALES
Una matrizcuadradaen la que todos los elementos fuera deladiagonal
son cero se denomina matriz diagonal; algunos ejemplos son
-m
0
Una matriz diagonal generalD n
0
X
D = [ do,
0
0 - 4
1
O
0
0
0
o
o
0
8
n se puede escribir como
O
d2
O
-I
6
1 0 0
principal
...
...
O
Una matriz diagonal es invertible si y sólo si todos los elementos en su diagonal
principal son diferentes de cero; en este caso la inversa de (1) es
El lector debe comprobar queDD- I = D"D = I.
Las potencias de las matrices diagonalesson fáciles de calcular; se deja para
el lector comprobar que si D es la matriz diagonal (1) y k es un entero positivo,
entonces
1.7 Matrices diagonales, triangulares y simétricas / 95
Ejemplo 1 Si
A=[:
-9 3
entonces
Los productos de matrices en que aparecen
cialmente fáciles de calcular. Por ejemplo,
[ Odl
d2
O O
o o
d3
][": :: 1:; "::]
factores lagonales sonespe-
'31
u32
'33
u34
dl'13
dlall
= [.a2]
d3a31
d2a22
d2a23
d2a24
d3a32
d3a33
d3'34
1
En palabras, paramultiplicarunamatriz
A por laizquierda por unamatriz
diagonal D, es posible multiplicar renglones sucesivos de
A por los elementos
diagonales sucesivos de D, y para multiplicar A por la derecha por D es posible
multiplicar columnas sucesivas de
A por los elementos diagonales sucesivosde D.
MATRICES
TRIANGULARES
Una matrizcuadradaen la que todoslos elementosarribadeladiagonal
principal
son cero se denomina triangular inferior, y una matriz cuadrada en la que todos
los elementosabajodeladiagonal
principal son cero se denomina triangular
superior. Una matriz que es triangular superior o triangular inferior se denomina
triangular.
Ejemplo 2
Una matriz triangularsuperior
ge-
gular inferior gene-
96
i
Sistemas de ecuaciones linealesy matrices
Nótese quea
ls matricesdiagonales son tanto triangulares superiores como triangulares inferiores, ya que tienen ceros por abajo y por arriba de la
diagonal principal. Nótese también que una matrizcuadrada en forma escalonada
es triangular superior porque tiene ceros por abajo de la diagonal principal.
A continuaciónseproporcionan
cuatro caracterizaciones útiles de las
matrices triangulares. El lector encontrará instructivo comprobar que las matrices
en el ejemplo 2 tienen las propiedades establecidas.
OBSERVACI~N.
Una matriz cuadrada A = [aij]es triangular superior si y sólo si el i-ésimo
renglón empieza con por lo menos i - 1 ceros.
Una matriz cuadrada A = [aij] es triangular inferior si y sólo si la j-ésima
columna empieza con por lo menos j - 1 ceros.
Una matriz cuadrada A = [aij] es triangular superior si y sólo si [aijJ = O
para i > j.
Una matriz cuadrada A = [aij] es triangular inferior si y sólo si [aij] = O
para i j.
En el siguiente teorema se enumeran algunas de las propiedades básicas de
las matrices triangulares.
Teorema 1.7.1.
a ) La transpuesta de una matriz triangular inferior es triangular superior, y
la transpuesta de una matriz triangular superiores triangular inferior.
b) El producto de matrices triangulares inferiores es triangular inferior, y el
producto de matrices triangulares superioreses triangular superior.
e> Una matriz triangular es invertible si y sólo si todos sus elementos diagonales son diferentesde cero.
d) La inversa de una matriz triangular inferior invertible es triangular inferior, J J la inversa de una matriz triangular superior invertiblees triangular
superior.
El inciso a) es evidente a partir del hecho de que la trasposición de una matriz
se puede efectuar reflejando los elementos con respecto a la diagonal principal; se
omite la demostraciónformal. Se demostrará b), pero las demostraciones de c) y 6)
se pospondrán para el siguiente capítulo, donde se contará con los medios para
probar los resultados de manera m á s eficaz.
Demostración de b). Se demostrará el resultado para matrices triangulares inferiores; la demostración para matricestriangulares superiores es semejante. SeanA
= lav] y B = [b - .] matrices triangulares inferiores n x n, y sea C = [c..] el
‘J
IJ
producto C = AB. Por la observación que precede a este teorema, se puede probar
que C es triangular inferior demostrandoque [c..]= O para i < j . Pero por la
1J
definición de multiplicación de matrices,
1.7Matrices diagonales, triangulares y simétricas / 97
s i se supone que i <j , entonces los términos de esta expresión se pueden agrupar
como sigue:
cij = ailbl, + aj2b, + . . . +'ai,- ,bi_
<
, + ajjbj,+ . . . + ainbn,,
Términos en los cuales el
número de renglón de b es
menor que el número de
columna de 6.
Términos en los cuales el
'número de renglón de a es
menor que el número de
columna de a.
En el primer agrupamiento, todos los factores 6 son cero, ya que B es triangular
inferior, y en el segundo agrupamiento todos los factores a son cero, ya que A es
triangular inferior. Así, cij = O, que es lo que se queda demostrar. 0
Ejemplo 3 Considerar las matrices triangulares superiores
3
A=[:
-
11
B=
-3
-2
o
o
O
0
"1
1
L a matriz A es invertible, ya que sus elementos diagonales sondiferentes de cero,
pero la matriz B no lo es. Se deja para el lector calcular la inversa deA aplicando
el método de la sección 1.5 y demostrar que
Esta inversa es triangular superior, como garantiza el inciso d) del teorema 1.7.l .
También se deja para el lector comprobar queel productoAB es
-2
AB=[:
:]
-2
Este productoes triangular superior,como garantiza el inciso 6) del teorema 1.7. l . A
MATRICES
SIMÉTRICAS
Unamatrizcuadrada
A es simétrica si A
= A T.
Ejemplo 4 Las siguientes matrices son simétricas, ya que cada una es igual a su
propia transpuesta (comprobar).
[-:-:I
-*4
-5
-3
O
:]
7
4
O
O
O
O
4
O
O
O
O
4
O
:]*
O
4
98
’;
Sistemas de ecuaciones Iineales y matrices
Es fácil reconocer las matrices simétricas por inspección: Los elementos de la
&agonal principal pueden ser cualesquiera,
peroa
s
l “imágenes especulares” delos otros
elementos de la matriz con respecto
a la diagonal principal deben ser
iguales (figura1).
Este hecho se concluye porque la transposición de una matriz cuadrada se puede
efectuar al intercambiar los elementos que son simétricos con respecto a la diagonal principal. Expresado en términos de los elementos individuales, una matriz
A = [a’.]es simétrica si y sólo si [a’.]= [u..]para todos los valores de i y j . Como
Y
Y
J’ .
se ilustra en el ejemplo 4, todas las matrices dlagonalesson simétricas.
En el siguiente teorema se enumeran las propiedades algebraicas más importantes de las matrices simétricas. Las demostraciones son consecuenciasdirectas del teorema I .4.9 y se dejan como ejercicios.
Teorema 1.7.2. Si ,4 y B son matrices simétricas del mismo tamaño y si k es
cualquier escalar, entonces:
a ) A es simétrica.
h ) A f B Y A - B son simétricas.
c ) kA essimktrica.
OBSERVACI~N. En general, no es cierto que el producto de matrices simétricas es
simétrico. Para ver esto, sean A y B matrices simétricas del mismo tamaño. Entonces por el inciso 4, del teorema 1.4.9 y por la simetría se tiene
AB)^= B ~ A B~A =
Como A B y BA suelen ser diferentes, se concluye que en términos generalesA B no
es simétrico. Sin embargo, en el caso especial en que A B = BA, el producto AB es
simétrico. Si A y B son matrices tales que A B = BA, entonces se dice que A y B
conmutan. En resumen: el producto de dos matrices simétricas es simétrico si y
sólo si las mafrices conmutun.
Ejemplo 5 En la primera de las siguientes ecuaciones se muestra un producto
de matrices simétricas que no es simétrico, y en la segunda se observa un producto de matrices simétricas que sí es sinlétrico. Se concluye que los factores de la
primera ecuación no conmutan, pero que los de la segunda sí lo hacen. Se deja
para el lector comprobar ambos hechos.
[::I[ -;;]=[I: :I
l .7 Matrices diagonales, triangulares y simétricas
/
99
En general, una matriz simétrica no necesariamente es invertible; por ejemplo, una matriz cuadradacero es simétrica, pero no invertible. Sin embargo, si una
matriz simétrica es invertible, entonces suinversa también es simétrica.
Teorema 1.1.3. Si A es una matriz simétrica invertible, entonces A"
trica.
es simé-
Demostración. Suponer que A es simétrica e invertible. Por el teorema 1.4.10 y
el hecho de que A = A T , se tiene
lo que demuestra queA"
MATRICES DE
LA FORMA A A T
YA ~ A
es simétrica.
0
Los productos matriciales de la forma A A T y ATA se presentan en varias aplicaciones. Si A es una matriz m x n, entonces AT es una matriz n X m, de modo
que los dos productos A A T y ATA son matrices cuadradas; la matriz A A T es de
tamaño m x m y la matriz ATA es de tamaño n x n. Estos productos siempre son
simétricos porque
Ejemplo 6 Sea A la matriz 2 x 3
Entonces
Observar queATA y A A T son simétricas, como era de esperarse. A
Más tarde en este texto se obtendrán condiciones generales para A bajo las
cuales A A T y ATA son invertibles. Sin embargo, para el caso especial en que A es
cuadrada, se tiene el siguiente resultado.
I
Teorema 1.7.4. Si A es una matriz invertible, entoncesAA y A TA también son
invertibles.
EJERCICIOS DE LA S E G C I ~ N1.7
2. Calcular el producto por inspección
-1
2
I
J. i,Cuiiles de las siguientes matrices son simétricas'?
5. Por lnspccctón, determinar
SI
la matriz triangular dada es invertible
6. 1:ncontrar todos los valores de a, b y
c
para los cuales A es simétrica
7
7. Encontrar todos los valores de a, b y c para los cuales A y B , ambas, no son invertibles.
8. Aplicar la ecuación dada para determinar por inspección si las matrices de la izquierda
conmutar.
1.7 Matrices diagonales, triangulares y simétricas
9. Demostrar que A y B conmutan si a
- d = 7b
10. Encontrar una matriz diagonalA
. que cumpla
[i -A -:]
o
a) A5 =
b) A
9
0
' =[o
4
o]
0
o o
1
11. a) Factorizar A en la forma A = BD, donde D es una matriz diagonal
b) La factorización efectuada, Les la única posible? Explicar la respuesta
12. Comprobar el teorema 1.7.1b para el producto AB, donde
[-i 31,
2
A=
s
2
;
-8
;]
13. Comprobar el teorema 1.7: 14para las matricesAy B del ejercicio 12
14. Comprobar el teorema 1.7.3 para la matriz dadaA .
15. Sea A una matriz simétnca.
a) Demostrar que A' es simétnca.
h) lkmostrar que 2 A 2 - 3A + I es simétrica
16. Sea A una matriz simétrica.
a) Demostrar queAk es simétrica si k es cualquier entero no negativo.
b) Si p(x) es un polinomio, Les necesariamente simétricop(A)? Explicar la respuesta
17. Sea '4 una matriz triangular superior y sea p ( x ) un polinomio @(A) es necesariamente
triangular superior? Explicar la respuesta.
18. Demostrar: Si ATA = A , entonces A es simétrica y A = A2
19. ;,Cuál es el número máximo de elementos distintos que puede contener
simktrica de n X n?
unamatriz
I
10 1
I02
/
Sistemas de ecuaciones linealesy matrices
21. Conbaseenlaexperienciaadquiridaenelejercicio
gencral que se pueda aplicar a
simétrica.
una fórmula para
a
i/
20, instrumentarunaprueba
a fin de determinar si A = u es
il
22. Una matriz cuadradaA se denomina untkimdtrica si ,4T = -A. Demostrar lo siguiente:
a) Si A es una matriz antisimétrica invertible,entor-ces A" es antisimétrica.
b] Si A y 4 son antisimétricas, entonces también lo son n T , A + B, A -+ B y kA para
cualquier escalar k.
c) roda matriz cuadrada se puede expresar como la suma de una matriz simétrica y
una matriz antisimétnca.
23. En el texto se demostró que el producto de matrices simétricas es simétrico si y sólo s i
lasmatricesconmutan.
El producto dematricesantisimétricasqueconmutan,
i es
antisimétrico'? Explicarla respuesta.
24. Si la matriz A IZ X n se puede expresar como A = LU, donde L es una matriz triangulm
inferior y li es una matriz triangular superior, entonces el sistema lineal Ax = b se
puede expresar comoLUX = b y se puede resolver en dos pasos:
Paso 1. Sea (:x = y, de modo que I,Cix = h se puede expresar como L y = b. Resolver
este slstc~na
Paso 2. Resolver el sistema U x = y para x.
En cada inciso, aplicar el método anterior de dos pasos para resolver el sistema dado
1 0 0 2 - 1
2
4
1
EJERCICIOS COMPLEMENTARIOS 1.7
I
1. IJsar eliminación de Gauss-Jordan para resolver parax' yy' en términos dex y y
x = $y- &'
y = Qx' + g y t
2. lisar climinación de Gauss-Jordan para resolver parax' y y' en términos de n y y .
3. Encontrar un sistema lineal homogéneo con dos ecuaciones que no sean múltiples entre
sí y tales que
1.7 Matrices diagonales, triangulares y simétricas I’ 103
x,= 1, x2 = - 1,
xj = 1,
xq
=2
Y
x2 = o,
x, = 2,
x j = 3,
x4 = - 1
sean soluciones del sistema.
4. Una caja contiene en total 13 monedas distintas de 1, 5 y 10 centavos, cuyo valor total
es de 83 centavos. ¿Cuántas monedas de cada denominación hay en la caja?
5. Encontrar enteros positivos que cumplan
x+ y+
z= 9
x+5y+ 10z=44
6. ¿Para qué valor(es) de a el siguiente sistema no tiene solución, tiene exactamente una
solución y tiene una infinidad de soluciones?
x,
+ x2 + xj = 4
xj = 2
(a2
- 4)x,
=a-2
7. Sea
la matriz aumentada de un sistema lineal. ¿Para qué
valores de a y b el sistema
única?
b) tiene
una
solución
de
un parámetro?
a) tiene una solución
c) tiene una solución de dos parámetros? d)
no tiene solución?
8. Resolver para x, y y z.
+ 3zy = 8
2*y 3 g y + 2zy = 7
-xy + fi + 2zy = 4
XY -
2$
-
9. Encontrar una matrizK tal que AKB = C dado que
10. ¿Cómo se debe elegir los coeficientes a, b y
c
y],
ax+3y-cz=
8
6
-4
de modo que el sistema
a x + b L ” 3 z = -3
”x-by+cz=
C=[
-1
-3
tengalasoluciónx= l , y = --I y z = 2 ?
11. En cada inciso, resolver la ecuación matncialparaX
6
-1
o
-6.
1
o.
104 i Sistemas de ecuaciones lineales4vmatrices
12.
a) Expresar las ecuaciones
YI =
y 2
y3
=
=
+
x1 - x,
3x,
+
x3
x* - 4x,
-2.w, - 2x2
21
Y
+ 3x,
=
4Y, -
z* = - 3,v,
."2
+Y3
+ 5y: - y,
en las formas matriciales Y = Ry Y Z = BY. Luego, usar estas formas
obtener una
relación directaZ = CX entre Z y X.
b) Usar la ecuación Z = CX obtenida en el inciso a) para expresarz1 y zz en términos
dex1,x2yx3.
c) Comprobar el resultado del inciso b) sustituyendo directamente las ecuaciones para
y,, y 2 yy3 en las ecuaciones parazI y z2 y luego simplificando.
13.
Si A es m X n y B es n X p , ¿cuántasoperacionesdemultiplicación
y cuintas
operaciones de adición son necesarias para calcular el producto matricial
AB?
14. Sea A una matriz cuadrada.
+
a) Demostrar que (I - A ) - . ' = I +- A + A'
A3 si A4 = O.
b)Demostrarque(/-A)"=l+A1-A2+~~~+A"siA"+'=U.
15.
Encontrar valores de u, b y c de niodo que la ghfica del polinOmio p(x) = t
d t bx + z
pase por los puntos ( I , 2), (- 1,6) y (2,3).
16. (Para lectofes qaeya estudiaron Cdculo.) Encontrar vaIores de a, b y c de modo que
la gráfica del polinomio p(x) = a? + bx +.c pase por el punto (- 1, O> y tenga una
tangente horizontal en (2, -9).
17. Sea J, la matriz n X n integrada completamente por elementos iguales 1. Demostrar
que
18.
Demostrarquesiunamatrizcuadrada
también AT cumple esta ecuación.
19.
Demostrar: Si B es invertible, entoncesAB"
A satisface A3
= B"A
+ 4A2 -
+
71,
entonces
si y sólo si AB = E4
20. Demostrar: Si A es invertible, entonces ambas A + B e I + BA"
ambas no son invertibles.
21.
2A
son lnvertibles o
Demostrar que si A y B son matrices n x n, entonces
a) tr(A
+ B ) = tr(A) + tr(B)
22. usar el ejercicio2 1 para
AB - B A = I .
b) tr(kA) = k tr(A)
c ) tr(A ') = tr(A)
d) tr(AB) = tr(BA)
demostrar que no existen matrices cuadradas
A y B tales que
dx
I . 7 Matrices diagonales, triangulares y simétricas
23. Demostrar: Si A es una matriz m
X n y B es la matriz n
por elementos iguales a Un, entonces
X
1 integrada completamente
donde 7,es la media de los elementos en eli-ésimo renglón deA .
son funciones diferenciables de
x, entonces se define
Demostrarquesi
los elementosde A y B sonfuncionesdiferenciablesde
x
y los
tattlaiim de a
ls matrices rim tales-fpe.es posible ejecutar 1% óperaciones indi&las,
entonces
a)
d
dA
(kA) = k dx
(b)
d
- (A
f
dA
B ) = -+
dB
1
d
(c) -(AB)
dx
dx
=
dx
25. (Para kcfores que ya estudiaron CcflcurO.) Usar elincisoc)delejercicio
demostrar que
+ A-dB
24
para
Escribir todas las hipótesis establecidas para obtener esta fórmula.
26. Encontrar los valores deA , B y C que hacen la ecuación
x2+x-2
(3x - l)(XZ
+ 1)
-
A
+-Bx*x++ C1
"
3x
-
1
una identidad. [Sugerencia Multiplicar todo por (3x - 1)(2 + 1) e igualar los coeficientes correspondientes de los polinomios en cada miembro de la ecuación resultante].
27. Si P es una matriz n X 1 tal que PTP = 1, entonces H = I
- 2PPT se denomina matriz
de Householdet correspondiente(enhonordelmatemáticoestadunidense
A. S.
Householder).
a) Comprobarque PTP = 1si PT = 3/4 1/61/4 5/12 5/12 y calcularlamatrizde
Householder correspondiente.
I'
105
106 / Sistemas de ecuaciones linealesy matrices
b) Demostrar quesi H es cualquier matriz de Householder, entonces H = HT y HTH = I.
c) Demostrar que la matriz de Householder determinada en el inciso a) satisface las
condiciones demostradas en el inciso b).
28. Suponiendo que las inversas indicadas existen, demostrar las siguientes igualdades.
29. a) Demostrar que si a # b , entonces
b) Usar el resultado del incisoa) para encontrar
[Nota Este ejercicio se basa en un problema de John M. Johnson, The Mathematics
Teacher, Vol. 85, No. 9, 1992.1
2
CAPITULO
DETEMINANTES
2.1
LA FUNCIÓN DETERMINANTE
El lector está familiarizado con funciones como Ax) = sen x y Ax) = x2, que
asocian un número real A x ) aun valor realdelavariable
x. Como x y Ax)
aLwmensólo valoresreales, tales funciones se describencomo 'yunciones con
valores reales de una variable real". En esta sección se estudiará la función
determinante, que es una "$unción con valores reales de una variable matricial"
en el sentido de que asocia un número real f o con una matriz X . El trabajo que
se efectuará sobre funciones determinantes tendrá importantes aplicaciones en la
teoría de sistemas de ecuaciones lineales
y también conducirá a una ,fórmula
explícita para calcular la inversade una matriz invertible.
De acuerdo con el teorema 1.4.5. la matriz
es invertible si ad - bc f O. La expresión ad - bc aparece con tanta frecuencia
en matemáticas que tiene un nombre; se llama determinante de la matriz A 2 X 2,
y se denota por el símbolo det(A). Con esta notación, la inversa de A se puede
expresar como
I07
108
/
Determinantes
Uno de los objetivos de este capítulo es obtener fórmulas d o g a s para matrices de
orden superior. Esto requerirá que se amplíe elconcepto de determinante a
matricesdeorden
superior. Para este fin seránnecesarios algunos resultados
preliminares sobre pennutaciones.
PERMUTACIONES
Definición. Una permutucidtz del conjunto de enteros { I , 2, . . . , n} es un
arreglo de éstos en algún ordensin omisiones ni repeticiones.
Ejemplo 1 Existen seis permutaciones diferentes del conjunto de enteros
que son
{ 1, 2, 3},
Un método conveniente para enumerar sistemáticamente las permutaciones
es por medio de un árho1 de permufacianes.Este método se ilustra en el siguiente
ejemplo.
. .
Ejemplo 2 Enumerar todas las permutaciones del conjunto deenteros { 1, 2, 3, 4).
"%jludbut, Considerar la figura l . Los cuatro puntos identlficados p z 1,-2, 3 , 4 en
la parte stlperior de la figwa feptesentliil -las elecciones posibles p a a el primer
número de la permutacidn. Las tres r a m a que salen de cada uno de estos puntos
representan las posibilidades para elegir la segunda posicibn en la permutación.
Entonces, si la permutación empieza como (2, -, -, -), las tres posibilidades
para la segunda posición son 1, 3 y 4. Las dos ramas que salen de cada punto enla
segunda posición representan las elecciones posibles para la tercera posición. Así,
si la permutación empieza como (2, 3, -, -), las dos elecciones posibles para la
tercera posición son 1 y 4. Por último, la rama que sale de cada punto en la tercera
posición representa la única elección posible para la cuarta posición. Entonces, si
la permutaciónparalacuarta
posición empieza como (2, 3, 4, -), la única
elección para la cuarta posiciónes 1. Ahora es posible enumerar las distintas
permutacionessiguiendo todas las trayectorias posiblesa lo largo del "árbol".
desde la primera posición hasta la última. Por medio de este proceso se obtiene la
siguiente lista.
2.1 L a funcirin determinante / 109
Apartirde
este ejemplo se observa que existen 24 permutaciones del
conjunto { 1, 2, 3, 4). Si se hubiera razonado como sigue, este resultado hubiera
podido anticiparse sin necesidad de enumerar realmente las pcrmutaciones. Como
l a primera posición puede ocuparse de cuatro formas y luego la segunda posición
las dos primeras
puede ocuparse de tres formas, hay 4.3 formasparaocupar
posiciones. Como la tercera posición se puedeocupar entonces en dos formas,
existen 4 3 2 formas para ocupar las tres primeras posiciones. Finalmente, como
la última posición se puede ocupar de una sola forma, existen 4 . 3 . 2 . 1 = 24
formas de ocupar las cuatro posiciones. En general, el conjunto { 1, 2, . . . , n }
tiene n(n - l ) ( n - 2). . . 2 . 1 = n! permutaciones diferentes.
I
Para denotar una permutación general del conjunto (1, 2, . . . , n}, se escribirá
j 2 , . . . , jn). Aquí, j , es el primer entero en la permutación, j , es el
segundo, y así sucesivamente. Se &ce que en una permutación
j 2 , . . . , j,)
ocurreuna inversión siemprequeun entero mayor precedea uno menor. El
número total de inversiones queocurrenenunapermutación
puedeobtenerse
como sigue: (1) encontrar el número deenteros que son menoresquejl y que están
despuésde j , enlapermutación; (2) encontrar el númerode enteros queson
menoresque j z y que están después de j , en la permutación.Continuar este
proceso de conteoparaj,, . . . ,jn-,. La suma de estos números es el número total
de inversiones que hay en la permutación.
u,,
Ejemplo 3 Determinar el númerode
permutaciones:
a) ( 6 , 1, 3, 4, 5, 2)
ol,
inversiones que hay en a
ls siguientes
b)(2,4, 1, 3)
c) (1,Z 3 , 4 )
Solucidn.
a) El número de inversiones es 5 + O + 1 + 1 + 1 = 8.
b) El número deinversiones es 1 + 2 + O = 3.
c) En esta permutación no hay inversiones. A
Definición. Se dice queunapermutaciónes
par si el número total de
inversiones es un entero par, y es impar si el número total de inversiones es un
entero impar.
II O
I
Determinantes
Ejemplo 4 En la tabla siguiente, cada una de las permutaciones de { 1, 2. 3) se
clasifica como par o impar.
DEFINICIóN DE
DETERMINANTE
Por producto elemental de una matriz A n X n se entiende cualquier producto de
n elementos de A , de los cuales ningún p a de elementosproviene delmismo
renglón o de la m i m a columna.
Ejemplo 5 Enumerar los productos elementales de las matrices
a)
a22
a31
032
a33
Solución de a). Como cada producto elemental tiene dos factores y cada factor
proviene de un renglón diferente, entonces unproducto elemental se puede escribir
en la forma
donde los espacios en blanco indican números de columna. Como ninguna pareja
de factores en el producto proviene de la misma columna, entonceslos números de
columna deben ser 1 2o 2 . Así. los únicos productos elementales son al ,a22 y
a12a21.
Solución de 6). Como cada producto elemental tiene tres factores, cada unode
10s cuales proviene de un renglón diferente, entonces unproducto elemental se
puede escribir en la forma
Como ninguna pareja de factores en el producto proviene de la misma columna.
entonces los niuneros de columna no tienen repeticiones; en consecuencia, deben
formar una permutación del conjunto { 1, 2, 3). Estas 3 ! = 6 permutaciones producen la siguiente lista de productos elementales.
2.1 La función determinante / 1I I
Como indica este ejemplo, unamatriz A de n X n tiene n! productos
j 2 , . . ,j,)
elementales. Son los productos de la forma aljla2 . . . a n y , donde
es una permutacióndel conjunto { 1, 2, 3, . . . , n{ Por un producto elemental con
signo de A se entenderá un producto elemental aljlazj2 . un? multiplicado por
+1 o por - 1. Si GI,j 2 , . . . ,Jn) es una permutación par se usa el signo +, y si (jl,
j2,. . . ,j,) es una permutación impar, se usael signo - .
olT
'
'
Ejemplo 6 Enumerar todos los productos elementales con signo de
las matrices
a)
['I'
b)
"I2]
aa2212
[
413
a12
a22
431
432
u33
Solución.
a)
-
Producto
elementalPermutación Producto
elemental
asociada
Par
4 ,la22
012421
o impar
signo
con
(L2)
(2, 1)
par
impar
a 1la22
-a12421
h)
Ahora ya es posible definir la íünción determinante.
Definición. Sea A una matriz cuadrada. La función determinante se denota
por det, y det(A) se define como la suma delos productos elementales con signo
de A . El númerodet(A) se denomina determinante deA .
112
/
Determinantes
EVALUACIóN DE
DETERMtNAN-
Ejemplo 7 Con referencia al ejemplo 6. se obtiene
Para no tener que memorizar estas expresiones dificiles de manejar, se sugiere usar técnicas mnemónicas que se describen en la figura 2. La primera fbrmula del ejemplo 7 se obtiene de la figura 2a al multiplicar los elementos de
la flecha hacia la derecha y restar el producto de los elementos de la flecha hacia
la izquierda. La segunda fórmuladel ejemplo 7 se obtiene escribiendo de nuevo las
columnas primera y segunda como se muestra en la figura 26. Luego, el detenninante se calcula sumando los productos de las flechas hacia la derecha y restando
del resultado la suma de los productos de las flechas hacia la izquierda.
Figura 2
a)
h)
Ejemplo 8 Evaluar los determinantes de
Solución, Con el método de la figura 2a se obtiene
det(A) = (3)( -2)
- (1)(4) = - 10
El mktodo de lafigura 26 produce
det(B) = (45) + (84)
+ (96) - (105) - ( - 48) - ( - 72) = 240
A
Advertencia. Se recalca que los métodos que se muestran en la figura 2 no funcionan para determinantes de matrices 4 X 4 o superiores.
2.1 La función determinante / I 1 3
La evaluación directa de determinantes a partir de la definición conduce a
dificultades de cómputo. En efecto, la evaluacióndirecta de un determinante 4 X 4
podría incluiría el cálculo de 4!= 24 productos elementales consigno, y un determinante 10 X 10 incluiría el cálculo de lo! = 3 628 800 productos elementales
con signo. Aplicando este método, inclusive la computadora digital más rápida es
incapaz de manejar en una cantidad razonable de
tiempo el cálculo de un determinante 25 X 25. Por consiguiente, gran parte del resto del capitulo se dedica al
desarrollo de propiedades de determinantes, que
simplficarán la evaluación deéstos.
COMENTARIOS
Esta secciónconcluye conalgunoscomentariossobre
la terminología y la notaSOBRE LA
ción. Primero, se observa que el símbolo A es otra notaciónpara det(A). Por ejemNOTACIóN Y LA plo, el determinante de una matriz de 3 X 3 se puede escribir como
TERMTNOLOGÍA
'13
all
a12
u13
a21
a22
a23
'31
'32
u33
Con la ultima notación, el determinante de la matrizA del ejemplo 8 se escribiría
como
En términos concretos,el determinantedeunamatriz
es un
número. Sin embargo, se acostumbra llabusarllligeramente de la terminología y
usar el término "determinante" para referirse a la matriz cuyo determinante está
siendo calculado. Así,
OBSERVACI~N.
se podría idenlficar como un determinante 2 x 2 y denominar 3 al elemento que
está en primer renglóny en la primera columnadel determinante.
Por último, se observa que el determinante de A a menudo se escribe simbólicamente como
I
donde
ol,
indica que los términos deben sumarse sobre todas las permutaciones
- se eligen en cada términosegún s i la permutación es
par o impar. Esta notación es útil cuando es necesario recalcar la definición de un
determinante.
j 2 , . . . , J n ) y los signos + o
EJERCICIOS DE LA SECCIóN 2.1
I . Ihcontrar el número de inversiones que hay en cada una de las siguientes permuta-
clones de 1.2. 3 , 3 , 5
a) ( 4 1 3 5 2 ) . b ) ( 5 7 4 2 l ) . c ) ( ~ 2 5 4 l ) . d ) ( 5 4 3 2 l ) . e ) ( l 2 3 4 5 ) . f ) ( l 4 2 3 5 ) .
2. Clasilicar cada una de las pennutaciones del ejercicio I como par o impar
E11 los
ejcruclos del 3 al 12, evaluar el deteminante.
3
I
-2
-1
1
2
13. 1:ncontrar todos los valorcs de ipara los cuales dct(A) = O.
14. Clasificar cada una de las permutaciones de { 1,2, 3 , 4 } como par O impar.
16. lJsar la formula obtenida en el ejercicio 15 para evaluar
-
4 - 9
9
2
5
6
1
2 -5
I
-2
o
2
4
-3
-2
17. llsar la definición de deteminante para evaluar
o
o
a ) O
0
5
o
o
0
0 - 3
0 - 4
o
0 - 1
O
0
2
0
0
0
0
0
0
0
18. Resolver para x.
5
0
0
0
o
o
o
0 - 4
O
0
0
0 - 2
3
0
O
1
O
0
o
o
o
b)O
I
1
O
-
3 x-5
19. Demostrar que el valor del determinante
0
2.2 Evaluación de determinantes por reducción de renglones / 11 S
no depende de O
20. Demostrar que si una matriz cuadrada A tiene un renglón o una columna de ceros,
entonces det(A) = O.
21. Demostrar que las matrices
conmutan si y sólo si
2.2 EVALUACI~NDE DETERMINANTES POR REDUCCI~NDE RENGLONES
En esta sección se mostrará que el determinante de una matriz se puede evaluar
expresando sise
reducelamatriza
la forma escalonada.Estemétodoes
importante, ya que evita los extensos cálculos que se presentan cuando se usa la
dejnición de determinante.
UN TEOREMA
BÁSICO
Se empezará con unteoremafundamental sobre determinantes.
Teorema 2.2.1. Sea A una matriz cuadrada.
a ) Si A tiene un renglón de ceros o una columna de ceros, entonces det@)= O.
6) det(A) = det(AT).
Demostración de a). Como todo producto elemental con signode A tiene un
factor decadarenglón y un factor de cadacolumna,entonces todoproducto
elemental con signo tiene necesariamente un factor de un renglón cero o de una
columna cero. En estos casos, todo producto elemental con signoes cero, y det(A),
que es la suma de los productos elementales con signo, es cero. 0
Se omite la demostración del inciso b), pero se recuerda que un producto
elemental tiene un factor de cada renglón y un factor de cada columna, de modo
que es evidente que A y AT tienen exactamente el mismo conjunto de productos
elementales. Mediantealgunosteoremas
sobre permutaciones, cuyo análisis
llevaria demasiado lejos, se puede demostrar que ,n realidad A y AT tienen el
mismo conjunto de productos elementales con signo. Esto significa que det(A) =
det(AT).
OBSERVACI~N. Debido al teorema 2.2.lb, casi
todos
los teoremas sobre
determinantes que contienen la palabra "renglón" en su enunciación también son
verdaderos cuando e11 VCY de "renglón" se escribe la palabra "columna". Para
demostrar una proposiciorl sobre columnas, basta transponer la matriz en cuestión
para convertir la proposicibn sobre columnas en una proposición sobre renglones,
y luego aplicar los resultados conocidos sobre renglones.
DETERMINANTES F1 sigtnicnte teorema facilita la evaluación del determinante de una matriz trianDE MATRICES
gular, sin imporlar su tamaito.
TRIANGULARES
Teorema 2.2.2. S i -4 es una matriz triangnlar w X n (triangularsuperior,
triangular inj>rior o diagonalj, pnronces dei(,4) es el producto de los elenlentos
de in diagonal principal; es decir, det(;.l) a , ,a7, . . a,,,,.
A fin de facilitar la notación. se demostrará el resultado para una matriz
triangular inferior 4 X 4
El razonamiento en el caso general n X n es semejante. Para matrices triangulares
superiores se puede obtener una demostración aplicando el teorema 2.2.lh y
observando quela transpuesta de una matriz triangular superior es una matriz
triangular inferior con los mismos elementos en la diagonal.
Dctmstrclc~rcirldel k m m a 2.2.2 (C'nso de una matriz lrianguiar injerior de 4 X
4).
El Único producto elemental de A que puede s a diferente de cero es a l la22a33a44.
Para ver que así cs. considerar un producto elemental representativo ~ ~ , , a ~ , ~ n ~ ,
Corno a , ? = o I 3 - a14= O
. se debe tenerjl = 1 a fin de tener un productoelemental
diferente de cero. Si ,jl = 1. se debe cumplir que j , = 1, y-¿que ninguna pareja de
factores comunes prmienc de a
l misma columna. Además, como
= a = O. se
24
debe tener], = 2 a fin de que el producto elementalsea d&rente de cero. Proslguicndo
de esta manera se obtienejB= 3 y j , = 3. Como n1lc122a33a44
se multiplica por +I
al formar el producto elemental con signo. se obtiene
Ejemplo 1
EFECTO DE LAS
OPERACIONES
2
7 - 3
0 - 3
7
O
O
6
8
5
7
O
0
3
1
6
0
0
9
8
0
0
0
4
= (2)( -3)(6)(9)(4)
= - 1296 A
El siguiente teorema muestra cómo una operación elemental en los renglones de
una matriz afecta el valor de su determinante.
2.2 Evaluación de determinantes por reducción de renglones / 1 1 7
~
ELEMENTALES
EN LOS
RENGLONES
SOBRE UN
DETERMINANTE
Teorema 2.2.3. Sea A una matriz n
X
n.
a ) SI B es la matriz que se obtiene cuando un solo rengldn o una sola
columna de A se nrultiplica por un escalar k, entonces det(B) = k det(A).
b) SI E: es la matriz que se obtiene cuando se intercambian dos renglones o
dos columnas de A , entonces del@) -det(A).
c ) Si B es la matriz que se obtiene cuando un múltiplo de un renglón de A .se
suma a otro renglón o cuando un múltiplo de una columna se suma a otra
columna, entonces det(B) = detjA).
z~
Una demostración de este teorema se puede obtener usando la fórmula (1) de la
sección 2.1 para calcular los determinantes que aparecen y comprobando después
a
ls igualdades. Se omite la demostración, aunquese proporciona el siguiente ejernplo que ilustra el teorema para determinantes3 X 3
Ejemplo 2
Relación
I
Operación
El primer renglón de A
se multiplica pork.
d e t ( B ) = k dct (. I)
u23
a22
a21
011
012
al3
a31
a32
u33
all
a12
013
= - a21
022
u23
a31
Los renglones primeroy
segundo deA se
intercambian.
"a3332
det ( B ) = - det ( 4)
I Un múltiplo del segundo
I
all
a22
+ kkafank212a,322 3
I 'I3 'I2
-
a21
'31
a32
a33
d c t ( R ) = det(:l)
'aa222321
a3 I
a 3a23 3
renglón de A se suma al
primer renglón.
118 / Determinantes
OBSERVACI~N. Como se observa en la primera ecuación del ejemplo 2,
a) del teorema 2.2.3 permite sacar del determinante un "factor común"
el inciso
de cual-
quier renglón (o columna).
DETERMINANTES DE
MATRICES
ELEMENTALES
Recordarqueunamatrizelemental
se obtiene cuando se efectúa unasola operación
elemental en
los
renglones
de una matriz identidad; así, si en el teorema
2.2.3 se hace que A = I,,, demodo que se tiene det(A) = der(/,) = 1, entonces la
matriz B es unamatriz elemental y elteoremaconduce
al siguiente resultado
sobre determinantesde matrices elementales.
Teorema 2.2.4. Sea E una matriz elemntal n X n.
a ) Si E se obtiene al multiplicar por k un renglón de In, entonces det(E) = k.
b) Si E se obtiene al intercambiar dos renglones de In, entonces det(E) = -1.
c) Si E
. se obtiene al sumar un múltiplo de un renglón de In a otro renglbn,
entonces det(E) = I .
Ejemplo 3 Los siguientes determinantes de matrices elementales. que se evalúan
por inspección, ilustran el teorema 2.2.4.
1
o
0
0
0
3
0
0
0
0
1
0
0
0
=3
0
1
El segundo renglón deI, se
multiplicó por 3.
DETERMINANTES CON
RENGLONES
O COLUMNAS
PROPORCIONALES
0 0 0 1
0 1 0 0
o 0 1 0
-1
1 0 0 7
0 1 0 0
0
0
1
0
=I
A
o 0 0 1
Se intercambiaron los
renglones primero y
liltimo de I,.
1 0 0
El liltimo renglón de I, se
sumó 7 veces al primer
renglón.
Si una matrizcuadrada A tiene dos renglones proporcionales, entonces sepuede
introducir un renglón de ceros sumando un múltiplo
adecuado de
uno
de los
renglonesa otro renglón. Lo mismo es cierto paracolumnas.Perosumar
un
múltiplo de un renglón o una columna a otro renglón o a otra columna no cambia
el determinante, demodoque por el teorema 2 . 2 . 1 ~se debe cumplirque det(A) =
O. Esto
demuestra
el siguiente teorema.
Teorema 2.2.5. Si A es una matriz cuadrada condos renglones o dos columnas
proporcionales, entonces detjil) = O.
Ejemplo 4 El siguiente cálculo ilustra la introducción de un renglón deceros
cuando hay dos renglones proporcionales:
2
6
1
1
-4
0
0
0
1
4
8
veces el primero, de modo que
renglón al segundo para
4
2.2 Evaluación de determinantes por reducción de renglones
1I Y
Cada una de las siguientes matrices tiene dos renglones o dos columnas proporcionales; así, por inspección, el determinantede cada una es cero.
EVALUACI~NDE
DETERMINANTES POR
REDUCCIóN DE
RENGLONES
A continuación se proporcionará un método para evaluar determinantes, el cual
requiere sustancialmente menos cálculos que la aplicación directa de la definición
de determinante. La idea del método es reducir la matriz dada a la forma triangular superior mediante operaciones elementales enlos renglones; luego, calcular
el determinante de la matriz triangular superior (lo que es fácil), y, finalmente,
relacionar el determinante de ésta con el determinante de la matriz original. A
continuación de presenta unejemplo.
Ejemplo 5 Evaluar det(A), donde
o
1
-6
A=[3
2
6
5
9
1
Solucidn. A se reducirá a la forma escalonada (que es triangular superior) y se
aplicará el teorema 2.2.3:
o
det(A)= 3
2
1
-6
6
5
9
1
2
-6
1
6
9
5
1
1
-2
3
5
1
3
=
- O
o
= -3
1
6
2
1
=
o
-3
O
-2
1
10
3
5
-5
el
primer renglón tomando en
Se sumó -2 veces el primer
renglón al tercer renglón.
-2
1
O
IO
1
=(-3)(-55)
o
O
=
31
5
-551
-2
1
0
(-3)(-55)(1)=
3
5
1
165 A
en el último renglón
considerando el signo del
OBSERVACI~N. El método de reducción de renglones se ajusta bien a la evaluación de determinantes por computadora, ya que es sistemático y se puede programar fácilmente. Sin embargo, en seccionesulteriores se desarrollarán métodos que
a menudo facilitan los cilculos manuales.
Ejemplo 6 Calcular el determinante de
Solución. Estedeterminante se puede calcular comoyasemostró,
mediante
operaciones elementales en los renglones para reducir A a la forma escalonada,
aunque A también se puede escribir enforma triangular inferior en un paso
sumando - 3 veces la primera columna a la cuarta para obtener
Este ejemplo señala lautilidad de no perder de vista las operaciones en las columnas que pueden abreviar los cálculos. A
EJERCICIOS DE LA SECCIÓN 2.2
1. Comprobar que det(A) = det(A7) para
2. Evaluar por inspección los siguientes determinantes
3. Encontrar por inspección los determinantes de las siguientes matrices elementales.
2.3 Propiedades de la función determinante
I’
121
En los ejercicios del 4 al 11, evalmr el determinante de la matriz dada refiuciendo la
matriz a forma escalonada.
3
6 -9
o 3 1
4.
5. [I
1 21
3 2 4
[-.;y
-;]
3a
36
[-:-; 11 [-: i -!]
1
6.
3c
3
-3
-6
7.
a+g
b+h
c+i
13. Por medio de la reducción de renglones demostrar que
ik; i 2 i
1
:2
= ( b - u)(c - a)(c - b)
14. Con un razonamiento semejante al de la demostración del teorema 2.2.2, mostrar que
;: 1
Y:l/ ;: 1
15. Demostrar los siguientes casos especiales del teorema2.2.3.
kat2
‘12
&I3
all/ =kl:::
a)
‘31
‘32
a33
‘31
a22
‘32
a22
u13
aI2
b)
u33
‘31
a32
=
‘33
-111:
a31
a12
az2
‘32
‘33
2.3 PROPIEDADES DE LA FUNCIÓNDETERMINANTE
En esta sección se desarrollarán algunas de las propiedades fundamentales de la
función determinante. Con el trabajo aquí realizado se adquirirán mayores conocimientos sobre la relación que hay entre una matriz cuadrada y su determinante.
Una de las consecuencias inmediatasde este material es una importante prueba de
determinante para lainvertibilidad de una matriz.
122 / Determinantes
PROPIEDADES
SkSICAS DE LOS
DETERMINANTES
Suponer que A y B son matrices n X n y que k es cualquier escalar. Se comenzará
considerando posibles relaciones entre det(A), det(E) y
det(U), det(A
+ B)
y det(AE)
Como del determinante puede sacarse un factor común de cualquier renglón
de una matriz, y como cada uno de los n renglones de kA tiene un factor común
igual a k , se obtiene
1 det(kA)
~
~~
= k"det(A)
1
Por ejemplo,
Desafortunadamente, en general no existe ninguna relación simple entre los
determinantes det(A), det(B) y det(A + B). En particular, se recalca que det(A + B )
suele no ser igual a det(A) + det(B). El siguiente ejemplo ilustra este hecho.
Ejemplo 1 Considerar
A pesar deltono negativo delejemplo anterior, existe una relación importante en la que intervienen sumas de determinantes que a menudo es útil. Para
obtenerla, considerar dos matrices 2 X 2 que sólo difieren en el segundo renglón:
= det
a21
Asi,
+ 6 2 1a 2 2
+ 622
2.3 Propiedades de la función determinante / 123
Este es un casoespecial del siguiente resultado general.
Teorema 2.3.1. Sean A , B y C matrices n X n que sólo difieren en un renglón,
por ejemplo, el r-ésimo, y suponer que elr-ésimorenglónde
C se puede
obtener sumando los elementos correspondientes de los r-ésimos renglones de
A y B. Entonces
det(C) = det(4) + det(B).
El mismo resultado es cierto para columnas.
Ejemplo 2 Con la evaluación de los determinantes sepuede comprobar que
det
DETERMINANTE
DE UN
PRODUCTODE
MATRICES
[
1
2
l+O
7
O
4+1
5
3
7+(-1)
] i i i]
=det[
+.et[:
-:]
A
Cuando se considera la complejidad de las definiciones de la multiplicación de
matrices y determinantes de una matriz, parecería improbable que exista alguna
relación simple entre ellas. Es esto lo que hace tan sorprendente la sencillez del
siguiente resultado. Se demostraráque si A y B sonmatricescuadradas del
mismo tamaño, entonces
det (AB) = det ( A ) det ( B )
(2)
Como la demostración de este teorema es bastante minuciosa, primeroes necesario
desarrollar algunos resultados preliminares. Se empezará con el caso especial de
(2) en que A es una matriz elemental. Debido a que este caso especial es sólo un
preludio a (2), se denomina lema.
Lema 2.3.2. Si B es una matriz n
entonces
I
det@B)
X
=
n y E es una matriz elemental n x n,
d e t p ) de@)
Demostracidn. Se considerarán tres casos, cada uno dependiendo de
la
operación enel renglón con quese obtiene E.
Caso 1. Si E se obtiene al multiplicar por k un renglón de Zn, entonces, por el
teorema 1.5.1, EB se obtiene a partir de B al multiplicar por k un renglón; así, por
el teorema 2.2.3a se tiene que
det(EB) = k det(B)
I24
/
Determinantes
Pero por el teorema 2.2.4a se tiene que det(E) = k, de modo que
det(EB) = det(@ det(R)
~,bsos2 y 3. Lasdemostracionesde
los casos en los que E se obtiene al
intercambiar dos renglones de I, o al sumar un múltiplo de un renglón a otro
renglón siguen el mismo patrón que el caso 1, por l o que se dejan como ejercicios.
0
OBSERVACI~N.
una matriz n
X
Por aplicaciones repetidas del lema 2.3.2 se concluye que si 5 es
n y E,, E2, . . . , E,. son matrices elementalesn x n, entonces
det(E ,E,. . 3 , B ) = det(E,)det(E2). . .det(E,.)det(B)
(31
Por ejemplo.
det(E,E,B)
PRUEBA DE LA
INVERTIBILKDAD
MEDIANTE UN
DETERMINAYTE
= det(E, j
det(E,B)
= det(E,)
det(E2) det(B)
El siguiente teorema esuno de los más importantes en álgebra iineal; proporciona
un criterio importante de invertibilidad entérminos de determinantes y se usará
en la demostración de (2).
Teorema 2.3.3. Una matriz cuadrada A es invertible si y sólo si det(A) = O.
Dernostración.
Sea R la forma escalonada reducida de A . Como paso preliminar
se demostrará quetanto det(A) como det(R)son cero o diferentes de cero: Sean E,.
E2, . . , , E,. las matrices elementales que corresponden a Las operaciones elementales en los renglones con quese obtiene R a partir de A . Así,
R =E;
'
.E2E1A
y según (3),
det(R) = det(E,). . .det(E,) det(E,)det(A)
(4)
Pero por el teorema2.2.4, los determirlantes dea
ls matrices elementales son Merentes
de cero. (Tomar en cuenta que multiplicar por cero un renglón no es una operación
elemental en los renglonespermitida de modo que k = O en esta aplicación del teorema
2.2.4.) Así, por (4) se concluye que det(A)y de@) son cero o diferentes de cero.Ahora
se procederá a la partemás importante dela demostración.
Si A es invertible, entonces por el teorema 1.6.4 se tiene R = I, de modo que
det(R) = 1 f O y, en consecuencia,det(A) f O . Recíprocamente, si det(A) f O,
entonces det(R) f O, de modo que R no puede contener un renglón de ceros. Por el
teorema 1.4.3 se concluye que R = I , de modo que por el teorema 1.6.4 se tiene que
A es invertible. [1
2.3 Propiedades de la funcióndeterminante / 125
Por los teoremas 2.3.3 y 2.2.5 se concluye que una matriz cuadrada con dos
renglones o columnas proporcionalesno es invertible.
Ejemplo 3 Como los renglones primeroy tercero de
son proporcionales, det(A) = O. Así, A no es invertible. A
Ahora ya es posible abordar el resultado principal de esta sección.
Teorema 2.3.4. Si A y B son matrices cuadradasde1 mismo tamafio, entonces
det(AB)
= det(A)
det(B).
Demostración. La demostración se dividirá en dos casos que dependen de si A
es invertible o no lo es. Si la matriz A no es invertible, entonces por el teorema
1.6.5 tampocolo es el producto AB. Así, por el teorema 2.3.3 se tiene que det(AB)
= O y det(A) = O, por tanto, se concluye que det(AB) = det(A) det(B).
Ahora se supone que A es invertible. Por el teorema 1.6.4, la matriz A se
puede expresar como producto de matriceselementales, por ejemplo
A
= E,E,. . .E,
(5)
de modo que
A B = E1E2.. .E,B
Si se aplica ( 3 ) a esta ecuación seobtiene
det(AB) = det(El) det(E2) . . . det(E,.) det(B)
y aplicando (3) de nuevo se obtiene
det(AB) = det(E,E2 . . . E,.) det(B)
que, según (5), se puede escribir como det(AB) = det(A) det(B)
Ejemplo 4 Considerar las matrices
Se deja al lector comprobar que
det(A) = 1 det(B) = -23 y det(AB)
=
-23
0
126
,/
Determinantes
Así, det(AB) = det(A) det(B), como garantiza el teorema 2.3.4. A
El siguiente teorema proporciona una relación útil entre el determinante de
una matriz invertible y el determinante de su inversa.
I Teorema 2.3.5. Si -4 es invertible, entonces
det(A") = -
Denrosfración. Como A "A = I, se concluye que det(A "A) = det(r). Por consiguiente, se debe tener que det(A -I) det(A) = 1. Como det(A) = O, la demostración
puede completarse dividiendo entre det(A). 0
SISTEMAS
LINEALES DE LA
FORMA A x = Ax
Muchas aplicaciones del álgebra lineal están relacionadas
con
sistemas
ecuaciones lineales en n incognitas que se expresan como
A x = Ax
de n
(6)
donde A es un escalar. Estos sistemas son realmente sistemas lineales homogéneos
encubiertos, ya que (6) puede escribirse de nuevo como x - A x = O o, insertando
una matriz identidad y factorizando. como
(dI-A)x=O
(7)
A continuación se proporciona un ejemplo.
Ejemplo 5 El sistema lineal
x, + 3x,
4x, 42x,
puede escribirse en forma matricial como
que es de la forma (6) con
Este sistemapuede volver a escribirse como
=
Ax,
=
Ax2
2.3 Propiedades de ¡afunción determinante / 127
O
A[:
;I[:] [::I[:] [:I
-
=
que es de la forma(7) con
AI-.=[
A-- 4 1
a-- 32 ]
El problema de interés esencial ensistemas lineales delaforma (7) es
determinar los valores de para los cuales el sistema tiene una solución no trivial;
ese valor de A se denomina valor característico o eigenvalor' de A . Si l e s un
eigenvalor de A , entonces las soluciones no triviales de (7) se denominan eigenvectores de A correspondientes a A.
De acuerdo con el teorema 2.3.3 se concluye que el sistema ( I - A)x = O
tiene una soluciónno trivial si y sólo si
Idet(lI-A)=O
I
ÉSta se denomina ecuacidn característica de A ; los eigenvalores de A se pueden
encontrar resolviendo esta ecuación para l.
Los eigenvalores y los eigenvectores se estudiarán denuevo
en otros
capítulos, donde se analizará su interpretación geométrica y se desarrollarán sus
propiedades conmayor profundidad.
Ejemplo 6 Determinar los eigenvalores y los eigenvectores correspondientes de la
matriz A del ejemplo 5.
Solución. La ecuación característica de A es
*La palabra elgenvalor es una combinación de alemán y espaiiol. El prefijo alemán ergen puede traducirse
como"propio",queresulta de l a s antiguaspublicacionesen l a s que l o s eigenvalores se conocíancomo
valores proplos; también se denominan raices latentes.
O
/2*-3a-
lo=o
La forma factorizada de esta ecuaciónes (A + 2)(A - 5 ) = O, demodoquelos
eigenvalorcs deA son A = - 2 y A = 5 ,
Por dcfinición,
es un eigenvectorde
decir.
Si A
=
4. si y sólo si x es una solución no trivial de ( I1 - A)x = O; es
-2, entonces (9) se convierte en
Al resolver este sistema se obtiene (comprobar)
x 1 = - t , x2 = 1
de modo que los eigenvectorescorrespondientesa
diferentes de cero de la forma
A
=
-2 son las soluciones
(9), los eigenvectores de '4 correspondientesa A
Denuevopor
solucioner no triviales de
= 5
son las
Se deja que el lector resuelva este sistema y demuestre que los eigenvectores de A
correspondientes a A = 5 son las soluciones diferentes de cero de la forma
RESUMEN
En el teorema 1.6.4 se mencionaron cinco resultados que son equivalentes a la
invertibilidad de una matriz A . Esta sección termina con la inclusión del teorema
2.3.3 enesa lista para obtener el siguiente teoremaque relaciona los temas
primordiales que se han estudiado hasta ahora.
2.3 Propiedades de lafunción determinante / 129
Teorema 2.3.6. Si A es una matriz n X n, entonces las siguientes proposiciones son equivalentes.
a ) A es invertible.
b ) Ax = O sólo tiene la solución trivial.
c ) La forma escalonada reducida de A es I,,.
d) A se puede expresar como un producto de matrices elementales.
e ) A x = b es consistente para toda matriz b n X 1.
fi Ax = b tiene exactamente una solución para toda matriz b n X 1.
g ) det(A) = O.
EJERCICIOS DE LA S E C C I ~ N2.3
1. Comprobar que det(kA) = k" det(A) para
2. Comprobar que det(AB) = det(A) det(B) para
[a
.-[i
2 1 0
A=
y
-1
I
i]
3. Por inspección, explicar por qué det(A)= O
-
2
4
8
-6
1
4
4
-3
4. Con el teorema 2.3.3, determinar cuáles de las siguientes matrices son invertibles
5. Sea
Suponiendo que det(A) = -7, determinar
a) det(3A)
b)
det(A")
c) det(2A")
6. Sin evaluar directamente demostrar quex = O y x = 2 satisfacen
130
,I
Determinantes
7. Sin evaluar directamente, demostrar que
lin los ejercicios del 8 al 1 1. demostrar la identidad sin evaluar los determinantes
12.
;t'arira qui valor(es) de k se cumple que A 110 es invertible?
13. Con el teorema 2.3.3. demostrar que
p
sen' y
cos2 a c o s ' p
cos2 y
sen1 (Y
210
sen '
es mvertible para cualesquieravalores de (x,
fi,
y y
14. k p r e s a r los siguientes sistemas lineales en la fonna ( I - A)x = O .
a) .Y, + 2.r, = AX,
h)
3.r, = A.vl
c)
3 . ~ , .y2 = d.Yl
23,
.xz = A.Y,
4s, 3Sl = Ax2
- 5.r, - 3.r, = ax,
+
+
+
+
15. Para cada uno de los sistemas del ejerclcio 14, encontrar
a) la ecuación característica,
b) los eigenvalores, >
c) los eigenvectores correspondientes a cada uno de los eigenvalores.
2.4 Desarrollo por cofactores; regla de Cramer / 13I
16. Sean A y B matrices n
det(A"BA).
X
n. Demostrar que si A es invertible, entonces det(B) =
17. a)Expresar
a,
a,
+ b,
+ b,
c, + d l
c,
+ d,
como una suma de cuatro determinantes
cuyos elementos no contengan sumas.
b) Expresar
+ bl CI + d l
+ 6 2 c2 + d2
a3 + b3 c3 + d3
a1
el
+fl
a2
e2
+f 2
e3
+f 3
como una suma de ocho determinantes cuyos elementos no contengan sumas.
18. Demostrar que una matriz cuadrada A es invertible s i y sólo si ATA es invertible.
19. Demostrar los casos 2 y 3 del lema 2.3.2.
2.4 DESARROLLO POR COFACTORES; REGLA DE CRAMER
~
~~
En esta sección se considerará un método para evaluar determinantes que es útil
en la realización de cálculosmanuales y revisteimportanciateórica.Como
consecuencia del trabajo aquí efectuado, se obtendrá una fórmula para calcular
la inversade una matrizinvertible, así comouna fórmula para encontrarla
solución de ciertos sistemade ecuaciones lineales en términos de determinantes.
MENORES Y
COFACTORES
Definición. Si A es una matriz cuadrada, entoncesel menor del elementoai se
denota por M,, y se define como el determinante de la submatriz que queda
después de q6itar el i-ésimo renglón y laj-ésima columna de A . El número
(- l)'+JM,,se denota por C,, y se denomina cofactor del elementou..
Ejemplo 1 Sea
A=[:
El menor del elemento a l l es
; i]
1
-4
?32
1)etermlnante.s
El cofactor de
I
es
De manera scmejante,el menor del elemento a32es
M;2
3
1
= 2
S
4
6
1
4
8 =
;1
=26
el cofactor de a32cs
Observar que el cofactor y el menor de un elemento al, sólo difieren en el signo; es
decir, C,j = "".4u. Una manera rápida para determinar si se usa el signo + o el
signo - es aplicar el hecho de que el signo que relaciona Cy con M está en el iu
Csimo renglón y en lajCsima columna del arreglo en
forma de "tablero de ajedrez"
...
DESARROLLOS
Considerar la matrizgeneral 3
POR
COFACTORES
X
3
-[." ;;; %J
a,,
-4
013
En el ejemplo 7 de la sección 2.1 se demostró que
2.4 Desarrollo por cofactores; regla de Cramer i 133
Debido a que las expresiones entre paréntesis son justamente los cofactores
Czl y C31(comprobar), se tiene que
c,,.
La ecuación (2) muestra que el determinante de A se puede calcular multiplicando
los elementosde la primeracolumna de A por sus cofactores y sumando los
producto resultantes. Esta forma de evaluar det(A) se denomina desarrollo por
cofactores a lo largo de la primera columna deA .
Ejemplo 2 Sea
A=
Evaluar det(A) por desarrollo por cofactores a lo largo de la primera columna de
A.
Solución. Por (2), se tiene que
=3(-4)-(-2)(-2)+5(3)=
-1
A
Reordenando los términos de (1) de vanas formas, es posible obtener otras
fórmulas como (2). No debe haber ningún problema en la comprobación de que
todas las siguientes igualdades son correctas (véase el ejercicio 28):
Como en cada ecuación todos los elementos y los cofactores provienen del mismo
renglón o de la misma columna. Estas ecuaciones se denominan desarrollos por
cofactores de det(A).
Los resultados que acaban de proporcionarse para matrices 3 x 3 constituyen un caso especial del siguiente teorema general, que se enuncia sin demostración,
I34
1'
Determinantes
Teorema 2.4.1. El determinante de unamatriz A n x n se puede calcular
multiplicando los elementos de cualquier renglón (o de cualquier columna) por
sus cofactores y sumando los productos resultantes; es decir, para cada I i n
y I j n, se tiene que
I
t
det(A) = aljClj+
+ -.. +aniCnJ
(Desarrollo por cofuctores a lo largo
de
la j-ésima columna)
det(A) = a,lC,l +
+anJCnj
(Desarrollopor cofdores a lo largo delié.&no renghjn)
I
I
I
Ejemplo 3 Sea A la matriz del ejemplo 2. Evaluar det(A) mediante desarrollo por
cofactores a lo largo del primer renglón.
Solución.
=3(-4)-(1)(-11)+0=
-1
Esto concuerda con el resultado obtenido en el ejemplo 2. A
En este ejemplo no fue necesario calcular el último cofactor, ya
que se multiplicó por cero. En general, la mejor estrategia para evaluar un determinante melante cofactores, hacer el desarrollo a lo largo del renglón o la columna que tengael mayor número de ccros.
OBSERVACI~N.
El desarrollo por cofactores y las operacionesen los renglones o en las
columnas se pueden combinar algunas veces para obtener un método efectivo de
evaluar determinantes. Elsiguiente ejemplo ilustra esta idea.
Ejemplo 4 Evaluar det(A), donde
A = [ l3
-2
-1
2
3
1
5
:I
53
2.4 Desarrollo por cofactores; regla de Cramer 1 I35
Sumando múltiplos idóneos del segundo renglón a los demás renglones se obtiene
Soluci&.
det(A)
=
0 - 1
1 2 0
0
O
1
1
1
3
8
3
1
3
0
-
-1
1
3
-
"
o 9 3
Desarrollo por
cofactores a lo largo de
la primera columna.
=
-18
A
En un desarrollo por cofactores,det(A)secalculamultiplicando
los elementosde un
renglón o una columna por sus cofadoresysumandolosproductosresultantes.Resulta
que si los elementos de cualquierrenglón se multiplican por loscofactores correspondientes de un renglón dijerente, la suma de tales productos siempre es cero.
(Este resultado también se cumple para columnas.) Aunque se omite la demostración
general, el siguiente ejemploilustra la idea de la demostración en
un caso especial.
ADJUNTA DE
UNA MATRIZ
Ejemplo 5 Sea
Considerar la cantidad
que se forma al multiplicar los elementos del primer renglón por los cofactores de
los elementoscorrespondientesen el tercer renglón y sumar los productosresultantes. A continuación se demostrará queesta cantidad es igual a cero mediante
la sigwente regla práctica. Obtener una nueva matriz A' sustituyendo el tercer
renglón de A por el primer renglón. Así,
- .
,
..
. ,
.
I36
/
Determinantes
Sean C',,, C3*.C,,loscofactoresde los elementos del tercer renglón de A'.
Como los dos primeros renglones de A y A' son iguales, y dado que en el cálculo
de C31,C32,C33,C',,, C,,y C',3 sÓ10 intervienen elementos de los dos primeros
renglones de A y A', se concluye que
Como A' tiene dos renglones idénticos,
det(A') = O
Por otro lado, al evaluar det(A') por desarrollo por cofactores a lo largo del tercer
renglón se obtiene
Por (4) y (5) se obtiene
Definición. Si A es cualquier matriz n
la matriz
X
n y C,, es el cofactor de ai/,
entonces
sedenomina matriz de cofactores deA . Latranspuesta
denomina adjunta A
dey se denota por adj(A).
Ejemplo 6 Sea
2
Los cofactores de A son
-4
o
de esta matriz se
2.3 Desarrollo por cofactores; regla de Cramer 1 13 7
C,, = 6
C,, = 12
c,, = 4
C, = 12
C,, = - 16
c,, = 2
C, =
-
C, = 16
10
C,, = 16
de modo que la matrizde cofactores es
y la adjunta de (A) es
adj (A) =
[
12
6
-16
4
2
16
-:"I
A
16
Ahora ya es posible obtener una fórmulapara la inversa de una matriz
invertible.
FÓRMULA PARA
LA INVERSA DE
UNA MATRIZ
Teorema 2.4.2. Si A es una matriz invertible, entonces
(6)
Demostración.
Primero se demostraraque
A adj(A) = det(il) I
138
Determinantes
(véame los renglones sombreados en las dos matricesanteriores).
Si i = j , entonces (7) es el desarrollo por cofactores de det(A) a lo largo del iésimo renglón deA (teorema2.4.1), y si i = j , entonces las letras a y los cofactores
provienen de renglones diferentes de A . de modo que el valor de (7) es cero. En
consecuencia.
det(A)
O
A adj(,4)=[
...
O
...
o
" '
]=det(A)I
(8)
det(A)
Dado que A es invertible, det(A)
escribirse como
1
det ( A )
=
O. Por tanto, la ecuación (8) puede volver a
[ A adj(A)] = I
O
[
.4 detiAj adj(A)
1
=I
Multiplicando por la izquierdaambos miembros porA
A - 1 =~ 1 adj(A)
det ( A )
-',se obtiene
0
Ejemplo 7 Por medio de (6), encontrar la inversa de la matrizA del ejemplo 6.
Solución. El lector puede comprobar que det(4
1
r
= 64. Así,
12
adj(A) = 6
i4
det ( A )
-16
A ~ -=1
APLICACIONES
DE LA
FóRMULA DE
LA ADJUNTA
PARA LA
INVERSA
I
4
2
16
12- 10
16-
Aunque el método del ejemplo precedente es razonable para invertir manualmente
matrices 3 X 3, el algoritmo de inversión que se analizó en la sección 1.5 es más
eficaz para matrices más grandes. Sin embargo,debe tenerse en cuenta que el método de la sección 1.5 es sólo unprocedimientodecómputo,mientras
quela
fórmula (6) es una fórmula real para encontrar la inversa. Como se verá a continuación, esta fórmula esútil para obtener propiedades de inversa.
la
En la sección 1.7 se establecieron sin demostración dos resultados sobre
inversas.
2.4 Desarrollo por cojactores; regla de Crawler
139
Teorema 1 . 7 . 1 ~ :Una matriz triangular es invertible si y sólo si todos sus
elementos diagonalesson diferentes de cero.
Teorema 1.7.ld: La inversa de una matriz triangular inferior invertible es
triangular inferior, y la inversa de una matriz triangular superior invertible es triangular superior.
Estos resultados se demostrarán a continuación usando la fórmula de la adjunta
para la inversa.
Demostración del teorema 1.7.I C . Sea A
sus elementos diagonalesson
=a
r/
una matriz triangular, de modo que
Por los teoremas 2.2.2 y 2.3.3, la matriz A es invertible si y sólo si
det(A) = a 1 1 u 2 2... annf O
que es verdadero si y sólo si todos los elementos de la diagonal son diferentes de
cero. 0
Se deja como ejercicio para el lector usar la fórmula de la adjunta de A"
parademostrarque si A = aiJ esuna matriz triangular invertible, entonces los
elementos diagonalessucesivos de A - son
(Véase el ejemplo 3 de la sección 1.7.)
Demostración del teorema I . 7.Id. El resultado se demostrará para matrices triangulares superiores y se dejará como ejercicio el caso para matrices triangulares
inferiores. Suponer queA es triangular superior e invertible. Como
se puede demostrar que A-' es triangular superior puede probarse probando que
adj(A) es triangular superior o, equivalentemente, que la matriz de cofactores es
triangular inferior. Lo anterior se puede lograr demostrando que todo cofactor C:
iJ
con i < j (es decir, arriba de la diagonal principal) es cero. Como
ciJ= ( -
i);+jM.
'J
140
/'
Determinantes
basta demostrar que cada menor My con i <j es cero. Para este propósito, sea By la
matriz que se obtiene cuando se quitan el i-ésimo renglóny laj-ésimacolumna deA, de
modo que
M,, = det@,,)
(9)
A partir de la hipótesis que i < j. se concluye que Bq es triangular superior
(ejercicio 32). Como A es triangular superior, su (i + I)-ésimo renglón comienza
con por lo menos i ceros. Pero el i-ésimo renglón de B, es el (i + 1)-ésimo renglón
de A sinel elementodelaj-ésimacolumna.
Ya que i < j, ninguno delos i
primeros ceros se elimina quitando la j-ésima columna;así, el i-ésimo renglón de
B comienza con por lo menos i ceros, lo cual indica que este renglón contiene un
i/
cero en la diagonal principal, Ahora,por el teorema 2.2.2 se concluye que det(BJ
= O, y por la expresión (9) se concluye que M,] = O . O
REGLA DE
CRAMER
El siguiente teoremaproporcionaunafórmula útil paralasolución de ciertos
sistemas lineales de n ecuaciones con n incógnitas. Estafórmula,denominada
*
re@ de Cramer , es de interés marginal para efectos de cómputo, aunque es útil
para estudiar las propiedades matemáticas de una soluciónsin necesidad de resolve< el sistema
Teorema 2.4.3. (Regla de Crumer). Si Ax b es un sistema de n ecuaciones
lineales con n incdgnitas tal que det(A) = O, entonces la solución del sistema
es única. Esta solucidn es
rz
donde 4
. J es la matriz que se obtiene al sustituir los elementos de la j-&into
columna de A por los elementos de la matriz
*Gabriel Cramer (1704-1752), matemático suizo. Aunque Cramer no está considerado
al lado de
los grandes
matemáticos
de
su
tiempo,
sus
contribuciones
como
diseminador
de
las
ideas
matemáticasleganaron
un bienmerecidolugar en lahistoriadelasmatemáticas.Cramerviaj6
bastante y conoció a muchos de los grandes matemáticos de su época. Estos contactos y amistades
condujeron a una correspondencia abundante a través de la cual
se difilndia la informacibn snbrt
nuevos descubrimientos matemáticos.
2.4 Desarrollo por cofactores; regla de Crarner / 141
Demostración. Si det(A) = O, entonces A es invertible y, según el teorema 1.6.2,
x = A"b es la única solución de Ax = b. En consecuencia,por el teorema 2.4.2 se
tiene
x=A"b=-
1
adj (A)b = det (A)
det (A)
Multiplicando las matrices se obtiene
Por consiguiente, el elemento en elj-ésimo renglónde x es
x, =
b l C , , + h2C,, f . .
. + b,Cn,
det (A)
Ahora, sea
Como Al difiere de A sólo en laj-ésima columna, se concluye que los cofactores de
los elementos b,, b2, . . . , b,, en A son los mismos que los cofactores de los ele1
mentos correspondientes en la j-&ma columna de A . En consecuencia, el desarrollo por cofactores de det(A)a lo largo de laj-ésima columna es
det(A,)
= b,C,,
+ b2CZj+ . . . + b,C,,
El trabajo más conocido
de
Crarner,
Introductron
ir l'analyse des lrgnes courbes
algébnques (1750), es un estudio y una clasificación de las curvas algebraicas; la regla de Cramer
apareció enel apéndice.Aunquelareglalleva
su nombre,variantesdelaideabásicafueron
planteadasantes porotrosmatemáticos.Sinembargo,lanotaciónsuperiordeCramerayudóa
aclarar y popularizarla técnica.
El exceso de trabajo, combinado con una caída de un carruaje, provocaron
su fallecimiento
en 1752. Aparentemente,Cramererauna
persona de buencorazón y agradable,aunquenunca
contrajo matrimonio. Sus intereses eran amplios. Escribió sobre filosofía de las leyes y del gobierno,
y sobre la historia de las matemáticas. Trabajó en una oficina pública, participó en la artillería y en
actividades de fortificaciones para el gobierno, instruyó a trabajadores sobre técnicas de reparación
de catedrales y efectuó excavaciones de archivos catedralicios. Cramer recibió numerosos honores
por sus actividades.
112
Determinantes
Sustituyendo este resultado en (10) se obtiene
det (Ai)
.Y
n
'=det(A)
Ejemplo 8 Aplicar la regla de Cramer para resolver
x, +
-
3x,
-.Y,
+ 2x,
= 6
+ 4 . +~ 6x3
~ = 30
2 s 2 + 3x, = S
-
Solucibn.
Por consiguiente.
~1="-
x3="
dCt(A,) - -40 -10
44 - 11'
det ( A )
det(.4,)
-
152 - 38 A
44
11
.x2=--
det(A,)
det(A)
-
72
18
44
11'
"-
"
det(A)
OBSERVACION. Para resolver un sistema de n ecuaciones con n incógnitas
mediante la regla de Cramer, es necesario evaluar n + 1 determinantes de matrices
n x n. Para sistemas con más de tres ecuaciones, la eliminación gaussiana es
bastante más eficaz, ya que sólo es necesario reducir una matriz aumentada n X (n
+ 1). Sin embargo, la regla de Cramer proporciona una fórmula para la solución si
el determinante de la matriz de coeficientes es diferente de cero.
EJERCICIOS DE LA S E C C I ~ '2.4
;~
1. Sea
2. Sea
4 - 1
A=
o
I
6
0 - 3 3
4
1
O 1 4
4
1
3
2
2.4 Desarrollo por cofactores; regla de Cramer / 143
3. Evaluar el determinante de la matriz del ejercicio 1 por desarrollo por cofactores a lo
largo de l o siguiente:
b) Laprimeracolumna.
a) Elprimerrenglón.
d) La segunda columna. e)' El tercer renglón.
c) El segundo renglón.
f) La tercera columna.
4. Para la matriz del ejercicio 1, encontrar
a) adj(A). b) A"
usando el teorema 2.4.2
En los ejercicios del 5 al 10, evaluar det(A) mediante desarrollo por cofactores a lo largo de
un renglón o una columna que el lector elija.
5. A = [
-3
2
o
7
5
I]
-1
o
5
-:-!]
3
tí. A = [ :
5
O
10. A =
2
En los ejercicios del 11 al 14, encontrarA"
3
-:-: :]
A -:]
2
11. A = [
2
13. A = [ :
5
-3
12. A = [
por medio del teorema2.4.2.
-:
-:
2
5
14. A = [
21
0
0
15. Sea
1
A=[;
1
3
1
1
3
2
2
: '8 i]
a) Evaluar A" usando el teorema 2.4.2.
b) Evaluar A" con el método del ejemplo 4 de la sección1.5.
c) ¿Cuál método requiere menos cálculos?
1:
4
0
0
1
i -!
2
2
4
2
0
144
'
Determinantes
En los ejercicios del I6 al 2 l . obtener la solución usandola regla de Cramer cuando sea aplicable.
16. 7 x , - 2 ~ =, 3
3.x,
x? = 5
17.
+
19.
x,
2s,
41-I
-
3.x2
+ x, =
-
.x2
=
-
4x
+ 5y
=2
18.
Ilx+ y+22=3
3x, =
+ 5y + 2z = 1
-.x1 - 4x, + 2 s , + .xj = -32
2x, - .x2 + 7x3 + 91, = 14
-x, + X2 + 3x, + Xq = 1 I
XI - 2s2 +
- 4x, = - 4
x
4
20.
-2
o
21.
x - ~ J + Z=
6
4x- y + 2 2 = - 1
2x + 2.v - 32 = -20
3x,
-x,
2x1
-
x*
+ 7x,
+
"
+ 6x2 -
xi = 4
2x, = I
X.,
x
i
22. Ilemostrar que la matriz
cos H
sen H
co;H
.-[:O
y]
O
cs invertible para todos los valores de d; luego, encontrarA"
23. Apllcar la regla de Cramer parahallary sin resolver parax, z y
4x+ v +
z t u'=
6
3x+7.v-
z+
M'=
1
usando el teorema 2.4.2
MJ
71-+3y-5z+8U.= -3
St y +
2+2w=
3
24. Sea A x = b el sistema del ejercicio 23.
a ) Resolver aplicando la regla de Cramer.
b) Obtener la solución por eliminación de Gauss-Jordan.
c) ¿,Cuál mktodo requiere menos cálculos?
25. Demostrar que si d 4 4 ) = 1 y todos los elementos de A son enteros, entonces todos los
elementos deA " son enteros.
26. Sea A x = b un slsterna de tz ecuaciones lineales con n incógnitas, coeficientes enteros y
constantes enteras. Demostrar que si det(A) = 1, la solución x tiene elementos enteros.
27. Demostrar que si 11 es una matIiz triangular inferior invertible, entonces A -I
gular mferior.
es trian-
28. Obtener los desarrollospor cofactoresprimero y último que se enumeran en la fórmula (3).
29. Demostrar: La ecuación de la recta que pasa por los puntos distintos ( a , ,b , ) y (a2,b z )
se puede escribir como
30. Demostrar: (x,, yl), (x2,y ? ) v (x3,y,) son puntos colineales si y sólo si
=5
Ejercicios complementarios
31. Demostrar: La ecuación del plano que pasa por
(a,, b,, cz) y
x
y
b,
a2 b2
a3 b3
a1
los puntos no colineales
( a , ,b , , c , ) ,
(u3,b,, c3)se puede escribir como
z
l
CI
1
c2
1
c3
1
=O
32. Demostrar que si A es triangular superior y B . . es la matriz que se obtiene cuando se
2/
eliminan el i-ésimo renglón y la j-ésima columna de A , entonces B . . es triangular
r/
superior SI i <j .
I EJERCICIOS COMPLEMENTARIOS
1. Con la regla de Cramer, resolver para
x’ y y’ en términos dex y y .
2. IJsar la regla de Cramer para que
x’ y y’ queden expresadas entérminos de x y y
x=x’cosO-y‘sen0
y=x’senO+y’cosO
3. Analizando el determinante de la matriz de
coeficientes, demostrar que el siguiente
sistema tiene una solución no trivial si y sólo si CY = p.
x+
y+m=o
x+
y+pz=o
z=o
ffx+py+
4. Sea A una matriz 3 X 3, cada uno de cuyos elementos es 1 6 O. ¿Cuál es el máxuno
valor posible deA ?
figura 1 que se muestra a continuación,
5. a) Para el tnángulo de la
para demostrar que
bcosy+ccosp=a
c
cos
a cos
CY
+ a cos y = b
p + b cos CY = c
y luego aplicar la regla de Cramer para demostrar que
cos
CY
=
b2
+ c2 - a2
2bc
usar trigonometria
/’
145
b) Con a
l rcgla de Crarner obtener fórmulas semejantes para cosp y cos y.
6. Por medlo de determinantes, demostrar que para todos los valores reales de jl la única
solución de
x - 2-v = Lx
x-
v
=
A.v
7. Demostrar: SiA es invertible, entonces adj(A) es mvertibley
'
1
[ adj ( A ) ] - = A
det (A)
8. Demostrar- Si A es una matriz n X
11,
= adj ( A - I )
entonces det [adj(A)] = [det(A)] '-l.
10. a) En la figura 2 que se muestra a contmuacion,
el área del triángulo ABC se puede
expresar como
IJsar Csto y el hechode que el área de un trapezoidees igual a 1/2 delaaltura
multiplicada por la suma delos lados paralelos, para demostrar que
[Notu En la obtención de esta fórmula, los vtrtices se identifican de modo que el
triángulo se traza en sentido contrario al movimiento de las manecillas del reloj
procediendo de ( x , ,y , ) a (x?,y 2 ) a (x3, ,y3). Para una orientación en el sentido del
movimiento de las nmnecillas del reloj, el determinante anterior produce el negutivo del área.]
b) Usar el resultado del inciso a), para determinar el área del triángulo con vkrtices ( 3 ,
31, (4, O), ("2, - 1).
Ejercicios complementarios / 147
Figura 2
D
E
F
11. Demostrar: Si la suma de los elementos en cada renglón de matriz
una A n X n es cero,
entonces el determinante deA es cero. [Sugerencia Considerar el producto M, donde
X es la matriz n X 1 cuyos elementos son iguales a 1.]
12. Sean A una matriz n x n y B la matriz que se obtiene cuando los renglones de A se
escriben en orden invertido. ¿Cómo están relacionados det(A)
y det(B)?
13. ¿Cómo se afecta A ” si
a) se intercambian los renglones i-ésimo yj-ésimo de A?
b) el i-ésimo renglón de A se multiplica por un escalar c diferente de cero?;
c) el i-ésimo renglón de A se suma c veces alfésimo renglón?
n . Suponer que B , se obtiene al sumar el mismo número
ta
cada elemento en el
z-ésimo renglón de A , y que B, se obtiene al restar t de cada
elemento en el z-ésimo renglón de A . Demostrar que det(A)= 112 [det(B,) + det(BJ1.
14. Sea A una matriz de n X
15. Sea
.=[a,;;j
u12
u13
a) Expresar det(1Z - A ) como un polinomiop(A) = ,I3 + bL2 + d + d.
b) Expresar los coeficientes b y d en términos de determinantesy trazas
16. Sin evaluar directamente el detexminante, demostrar que
+
sen ct cos a sen ( a 6)
s e n p cos
sen ( p + S) = 0
s e n y cos y s e n ( ? + 6)
17. Usar el hecho de que 21 375, 38 798, 34 162, 40 223 y 79 154 son, todos, divisibles
entre 19 para demostrar que
2
3
3
4
7
1
8
4
0
9
3
7
1
2
1
7
9
6
2
5
5
8
2
3
4
I48
Determinantes
cs divisiblc entre 19 sin evaluar directamente el determinante
CAPhULO
3
VECTORES EN LOS
ESPACIOS
BIDIMENSIONAL Y
TRIIDIMENSIONAL
Los lectores familiarizados con el contenido de este capítulo pueden omitirlo y
pasar al capítulo 4 sin pérdida decontinuidad.
3.1
INTRODUCCI~NA LOS VECTORES (GEOMÉTRICA)
~~~~~~~
~~~~~
~
~
~~~~~~
~~
~
~
Muchas cantidades fisicas, como área, longitud,masaytemperatura
quedan
descritas una vez que se conoce la magnitud de la cantidad. Esas cantidades se
denominan escalares. Otras CantidudesJsicus, denominadas vectores, no quedan
determinadas sino hasta que se especijkan una magnitud y una dirección. Un
caso sería la descripción del movimiento del viento que suele hacerse dando su
rapidez y dirección, por ejemplo 20 kph noreste. La rapidez y la dirección del
viento constituyen una cantidad vectorial denominada velocidad del viento. Otros
ejemplos de vectores son la fuerza y el desplazamiento. En esta sección se hará
unapresentacióngeométrica de los vectores en los espacios bidimensional y
tridimensional, se definirán las operaciones aritméticas con vectores y se establecerán algunas propiedades básicasde estas operaciones.
VECTORES
GEOMÉTRICOS
Losvectoressepuedenrepresentargeométricamentecomosegmentosde
recta
dirigidos o flechas en el espacio bidimensional o en el espacio tridimensional;
la dirección y la longitud de la flecha especifican, respectivamente, la dirección y la magnitud del vector. La cola de l a flecha se denomina punto inicial
del vector y lapunta, puntoterminal. Losvectores se denotarán conminúsculas negritas (por ejemplo, a, k, v. w y x). Cuando se analizan vectores,
los números se denominan escalares. Todos los escalares serán números reales y se denotarán por minúsculas cursivas (porejemplo,, a, k, v, w y x),
149
150 / Vectores en los espacios bidilnensional y tridimensional
Si,comoen la figura l a , el punto inicial deun vector v es A y el punto
terminal es B. se escribe
-4
v=AB
a)
Figura 1
E
b)
l
Vectores
equivalentes
Los vectores con la misma longitud y dirección, como los de la figura l b , se
denominan equivalentes. Como se quierequeunvectorquededeterminado
solamente por su longitud y su dirección, los vectores equivalentes se consideran
como iguales aun cuando puedanestar ubicados en posiciones diferentes. Si v y w
son equivalentes, se escribe
v=w
Definición. Si v y w son dos vectores cualesquiera, entonces la suma v + w es
el vector determinado como sigue: El vector w se coloca de modo que su punto
inicial coincida con el punto terminal de v. El vector v + w se representa por la
flecha que va del punto inicial de v al punto terminalde w (figura 2a).
En la figura 26 se han construido dos sumas, v + w (flecha blanca) y w + v
(flecha negra). Resulta evidente que
v+w=w+v
y que la suma coincide con la diagonal del paraleiogramo determinado por v y w
cuando estos vectores se colocan de modo que tienenel mismo punto inicial.
El vector de longitud cero
se denomina vector cero y se denota porO. Se define
O+v=v+O=v
para todo vector v. Como para el vector cero no existe ninguna dirección natural,
se acuerdaque es posible asignarle cualquier dirección convenientepara el
problema en cuestión.
Si v es cualquier vector diferente de cero, entonces "v, el negutivo de v, sc define
como el vector que tiene la misma magnitud quev, pero dirección opuesta (Figura3).
Figura 3
IEl negativo de v tiene la m i s m a longitud que v, pero su direcciónes opuesta. I
Este vector tiene la propiedad
v+(-v)=O
(¿Por qué?) Además, se define -O
sigue.
= O.
La sustracción de vectores se define como
Definición. Si v y w son dos vectores cualesquiera, entonces la dijierenciu de
w con respecto a v se define como
v-w=v+(-w)
Para obtener la diferencia v - w sin construir "w, v y w se colocande
modo que coincidan sus puntos iniciales; entonces, el vector del punto terminal de
w al punto terminalde v es el vector v - w (figura 46).
Definición. Si v es un vector diferente de cero y k es un número real (escalar)
diferente de cero, entonces el producto kv se define como elvectorcuya
longitud es I k [ veces la longitud de v y cuya dirección es la misma que la de v
si k > O y es opuesta a la dev si k O. Si k = O o v = O, se define kv = O.
En la figura 5 se ilustra la relación entreun vector v y los vectores T1 V ,
(- l)v, 2v y (-3)v. Observar que el vector (- I)v tiene la misma longitud que v,
pero dirección opuesta. Así, (- l)v es simplemente el negativo de v; es decir,
(- l)v = -v.
/'
Un vector de la forma kv se denomina multiplo escalar de v. En la figura 5
se observa que los vectores que son múltiplos escalares entre sí son paralelos.
Rccíprocamentc. se puede demostrar que los vectores paralelos diferentes de cero
son múltiplos escalares entre sí. Se omite la demostración.
VECTORES EN
SISTEMAS DE
COORDENADAS
Los problemas con vectores a menudo se pueden simplificar introduciendo un
sistema de coordenadas rectangulares. Por ahora, el análisis se limitará a vectores
en el espacio bidimensional (el plano). Sea v cualquier vector en el plano y suponer.
como se muestra en la figura 6, que v se ha colocado de modo que su punto inicial
está en el origen de un sistema de coordenadas rectangulares. Las coordenadas (vl.
v2) del punto terminal de v se denominan componentes de v , y se escribe
Si vectores equivalentes v y w se colocan de modo que sus puntos iniciales
estén en el origen, entonces resulta evidente que sus puntos terminales deben coincidir (ya que los vectores tienen la misma longitud y la misma dirección); así. los
vectores tienen las mismas componentes. Recíprocamente, los vectores con las
mismas componentes son equivalentes, ya que tienen las misma longitud y la
misma dirección. En resumen. dos vectores
v = (VI. v2) y w
=
(MIl.
w2)
son equivalentes si y sólo si
Ill
-w 1
y v2
-
w2
ty
~i~~~~ 6
v l y v 2 son las componentes de v.
Las operaciones de suma vectorial y multiplicación por escalares son fáciles
de efectuar en términos de componentes. Como se ilustra en la figura 7, si
v = ( V I ' \I2)
y w = (wl. w2)
3.1 Introducridn u los vectores (geométricu) / 153
entonces
r
v
Figura 7
+ w = ( U i+ w,,u, + w2)
L - 1 - i - U J - r
Si v = (vl, v2) y k es cualquier escalar, entonces mediante un razonamiento
geométrico con triángulos semejantes se puede demostrar (ejercicio 15) que
(Figura 8). Así, por ejemplo, si v = (1, -2) y w
= (7,
6), entonces
~+~=(1,-2)+(7,6)=(1+7,-2+6)=(8,4)
Y
4 ~ = 4 ( 1 ,-2)=(4(1),4(-2))=(4,
Como v - w
=v
+ (- I)w, por las fórmulas (1) y (2) se concluye que
I
(Comprobarlo.)
tY
-8)
v -w
= (u1 - w1,u, - w,)
I
154 / Vectores en los espacios bidimensionaly tridimensional
VECTORES EN
EL ESPACIO
TRIDIRIENSIONAL
Así comolosvectores
en el plano sepueden describir por parejas denúmeros
reales, los vectores en el espaciotridimensional sepueden describir por ternas de
números reales introduciendo un sistema de coordenadas
rectangulares.
Para
construir ese sistema de coordenadas, se elige un punto O, denominado el origen,
y se eligen tres rectas perpendiculares entre si, denominadas ejes de coordenadas,
que pasan por el origen. Los ejes seidentifican con x, y y z y se elige una dirección
positiva para cada eje de coordenadas,así como una unidad de longitud para medir
distancias (figura 9a). Cadapar deejesde
coordenadasdetermina un plano
denominado plano de coordenadas.Estos planosse denominan plano x y , plano xz
y plano yz. A cada punto P en el espacio tridimensional corresponde unaterna de
números (x, y , z ) denominados coordenadas de P, como sigue: Por P se hacen
pasar tres planos paralelos a los planos de coordenadas, y los puntos de intersección de estos planos con los tres ejes de coordenadas se denotan por X. Y y Z
(figura 9h).
f'
Figura 9
b
Las coordenadas deP se definen como las longitudes con signo
x=ox,y=oY,z=oz
En la figura 10 se muestra la grX1ca de los puntos cuyas coordenadas son(4, 5, 6)
y (-3, 2, -4).
Figura 10
I
3.1 Introducción a los vectores (qeornétrica)
1
155
Los sistemas de coordenadas rectangulares en el espacio tridimensional se
clas~lcanen dos categorías: izquierdos y derechos. Un sistema derecho tiene l a
propiedad de que un tornillo normal que apunta en la dirección positiva del eje z
debe avanzar si el eje x positivo se hace girar 90° hacia el eje y positivo (figura
I l a ) ;el sistema es izquierdo si el tornillo retrocede (figura 1l b ) .
OBSERVACI~N.
Figura 11
En este libro sólo se usarán sistemas de coordenadas derechos.
t“
t‘
I Derecho I
I Izquierdo I
Si, como se observa en la figura 12, un vector v en el espacio tridimensional
se colocademodo
que su punto inicial esté en el origen de unsistema de
coordenadas rectangulares, entonces las coordenadas del puntoterminal
se
denominan componentes de v y se escribe
v = (VI, v2, v3)
Si v = (vl, v2, v3) y w = (wl, w2,w3) son dos vectores en el espacio tridimensional,
entonces se pueden usar razonamientos semejantes a
los que se siguieron para
vectores en elplano a fin deestablecer los siguientes resultados
v y w son equivalentes si y sólo si v1 = wl, v2 = w2,v3 = w3.
v + w = (vl + w l , vz + w2,v3 + w3).
kv = ( k v , , kv,, kv,), donde k es cualquier escalar.
Ejemplo 1 Si v = (1, -3,2) y w
= (4,2,
l), entonces
V + W = ( S , -1,3),
2 ~ = ( 2 -, 6 , 4 )-, ~ = ( - 4 ,
v - w = v + ( - w ) = ( - ~ , -5,l) A
......
-2, - 1 )
156 / Vectoves enlos espacios bidimensionaly tridimensional
Algunas veces un vector se coloca de modo que su punto inicial no esté en el
origen. Si el vector P,P2 tiene como punto inicial a Pl(x,, Y , , 2 , ) y como punto
terminal P2(x2,yz, z,), entonces
A
I p,p;
I
= (x2 - X I , Y2 - Y , , 22
-
Es decir, las componentes de P I P , se obtienen al restar las coordenadas del punto
inicial de+
las coordenadas del punto terminal. Esto se puede ver usando la figura 1;
el vector P I P, es la diferencia de los vectores OP, y OP, ,de modo que
"
)
Figura 13
!
d
Ejemplo 2 Las componentes del vector v = P,P, con punto inicial P,(2, - 1, 4) y
punto terminal P,(7, 5, -8) son
En el espacio bidimensional, el vector con punto inicial P,(xl, yl) y punto
terminal P2(x2,y,) es
TRASLACI~N
DE EJES
Lassoluciones demuchos problemas se pueden simplificar trasladando losejesde
coordenadas
para
obtener
nuevos
ejes paralelos a los originales.
Enlafigura14a,
los ejes deunsistemadecoordenadas
xy se han
trasladado para obtener un sistemax'y' cuyo origen O' está en el punto (x, y ) = ( k ,
4. Un punto P en el espacio bidimensional ahoratiene las dos coordenadas(x, y ) y
( 2 , y'). Para ver
cómo se relacionan las coordenadas, considerar elvector G'?
(figura 14b). En el sistema x y , su punto inicial está en (k, l) y su punto terminal
3.1 Introducción a los vectores (geométrica) / 157
t'
Figura 14
4
6)
"----*
está en (x, y), de modo que O'P = (x - k, y - 0. En el sistema x", su punto
inicial está en (O, O) y su punto terminal esti en ( Y , y'), de modo que O'P = (x', y').
Por consiguiente,
Ejemplo 3 Suponer que un sistemade coordenadas xy se traslada para obtener un
sistema de coordenadas x? cuyo origen tiene las coordenadas (k, I> = (4, 1).
a) Encontrar las coordenadas.xp'del punto cuyas coordenadasxy son P(2, O).
b) Encontrar las coordenadasxy del punto cuyas coordenadas x y son Q( - I , 5).
Solución de a). Las ecuaciones de traslación son
x'=x - 4
y'=y - 1
de modo que las coordenadas x'y' de P(2, O) son x' = 2 - 4 = -2 y y' = O - 1 = - l.
Solución de b ) . Las ecuaciones de traslación en a) se pueden volver a escribir
como
x=x'+4
y=y'+ 1
de modo que las coordenadas xy de Q son x = - 1 + 4 = 3 y y = 5 + 1 = 6 . A
En el espacio tridimensional, las ecuaciones de traslación son
x ' = x - ~
y'=y-/
z ' = z - ~
donde (k, I, m) son las coordenadas xyz del origen x y z '
EJERCICIOS DE LA SECCIÓN 3.1
l . Trazar un sistema de coordenadas derechoy localizar los puntos cuyas coordenadas son
S. linconlrar un vector 11 diferente de cero cuyo punto terminal esQ(3, O, -5) tal que
a) II tiene la mismn dlrecclón que v = (4, -2, - 1 ).
b', II tiene direccibn opuesta a l a de v = (4, -2. - I ) .
6. S C ~ U
I ~= (-3,
a) v
"w
I ,
21, v
= (4- O,
b) 6 u + 2cv)
-8)
> w = ( 6 , - 1,
-v+ u
-4). Encontrar las componentes de
d) 5 t v - 4 ~ )
f) ( 2 ~ - 7 w ) - ( 8 v +
-3(v-Xw)
e)
7. Sean u, v y w los vcctores del ejercicio 6 . Encontrar las componentes del vector x que
satist'acc ¿I 2u - v + x = 7n +- \v.
8. Sean u. v y w los vectores del ejercicio 6. lhcontrar los escalares e l , c2 y c3 tales que
9. Ikmostrar que no existen los cscalares c l . c2 y c3 tales que
C,(-2.9,6)-~i.L(-3,2,1)+Cj(l,7,5)=(0,sr4)
11. sean t' el punto (2, 3, -2) 1 Q el punto (7, -4,1).
a) Encontrar el punto medio del segmento de recta que une a P y Q.
b) Encontrar el punto sobre el segmento de recta que une a P y Q y está a
dlstancla de P il 0.
$ de la
l a traslación da u11 sistema decoordenadasse
haceparaobtener
sistema de coordenadasx!v' cuyo origen O' tiene las coordenadas(2, -3).
a) Encontrar las coordenadas x'v' del punto P cuyas coordenadasxy son (7, 5).
b) Encontrar las coordenadas x?/ del punto 0 cuyas coordenadasxIv'son ( - 3 , 6)
c) Trrvar los ejes de coordenadasq~y ,Y?'? localizar los puntos P 4 Q.
12. Suponerque
un
U)
3.2 Norma de un vector: aritmética vectorial / 159
13. Suponer que un sistema de coordenadas xyz se traslada para obtener un sistema de
coordenadas x’y’z’. Sea v un vector cuyas componentesson v = (vl, v2, v3) en el sistema
xyz. Demostrar que v tiene lasmismas componentes en el sistemax‘y‘z‘.
14. Encontrar las componentes deu, Y, u + v y u
- v de los vectores que se muestran en la
figura 15.
t’
Figura 15
15.
Demostrar geométricamente que si v = (vl, K~),
entonces kv = ( k v , , kv2 ):, (Limitar la
demostración al caso k > O que se ilustra en la figura
8. La demostraclon completa
requiere de varios casos que dependen del signo de k y del cuadrante en que se encuentra el vector.)
3.2 NORMA DE UN VECTOR: ARITMÉTICA
VECTORIAL
En esta sección se establecerán las reglas básicas de la aritmética
vectorial.
PROPIEDADES
DE LAS
OPERACIONES
VECTORIALES
En el siguiente teorema se enumeran las propiedadesmásimportantes
vectores en los espacios
bidimensional y tridimensional.
de los
Teorema 3.2.1. Si u, v y w son vectores en el espacio bidimensional o en el
espacio tridimensionaly k y I son escalares, entonces se cumplen las siguientes
relaciones.
a)
c)
e)
g)
I
u+v=v+u
u+o=o+u=u
k(lu) = (k1)u
( k + 1)u = ku + Zu
b) ( u + v ) + w = u + ( v + w )
d ) u+(-u)=O
f ) k<u+ v) = ku kv
h) l u = u
+
I
Antes de explicar la demostración,se observa que se han desarrollado dos métodos
para el estudio de los vectores: el geométrico, en el quelos vectores se representan
por flechas o segmentos de rectas dirigidos, y el analítico, donde los vectores se
I60 / Vectores en los espacios bidinlensional y tridimensional
representan por parejas o ternas de números denominados componentes. Como
consecuencia, las ecuaciones del teorema 3.2.1 se pueden demostrar geométrica o
analíticamente. Para ilustrar este hecho, el inciso 6) se demostrará de ambas
formas. Las demás demostraciones se dejan como ejercicio.
Ilemosiración del itxiso a) (analítica). La demostración se hará para vectores en
el espacio tridimensional; la demostración para el espacio bidimenslonal es semejante. Si u = (u,. u2, u3), v = (vl, v2, v3) y w = (wl, w2,w3),entonces
Denlostrac,,n del itlciso 6) (geométrica). Sean u. v y w cuyas representaciones
"
PQ. QR y RS se muestran en la figura 1 . Entonces
-
v+w=QS
y
-
u+(v+w)=PS
También.
+
u+v=PR
4'
-
(u+v)+w=PS
Por consiguiente.
u+(v+w)=(u+v)+w
O B S E R V A C I ~ N . En vista del inciso b) de este teorema, el símbolo u + v + w está
bien definido, ya que la misma suma se obtiene sin importar dónde se escriban
paréntesis. Además, si los vectores u, v y w se colocan "punta con cola", entonces
la suma u + v + w es el vector que va del punto inicial de u al punto final de w
(figura 1).
Figura 1
Los vectores u + (v + w)y (u + v) + w son iguales.
3.2 Norma de un vector: aritmética vectorial / 161
NORMA DE UN
VECTOR
La longitud de un vector u a menudo se denomina norma de u y se denota por
11u((. De
acuerdo
con
el teorema
de
Pitágoras
se concluye que
la
norma
de un
vector u = (u1, u2)en el espacio bidimensionales
(1)
(Figura 2 4 . Sea u = (ul, u2, u3) un vector en el espacio tridimensional. Usando la
figura 2b y dos aplicaciones del teorema de Pitágoras se obtiene
Asi,
f’
t*
I
I
Figura 2
Un vector de norma1 se denomina vector unitario.
Si Pl(xl, y,, zl) y P2(x2, y 2 , z 2 ) son dos puntos en el espacio tridimensional, entonces la distancia d entre los puntos es la norma del vector
PIP2
(figura 3). Ya que
-
por ( 2 ) se concluye que
162 1 Vrctorrs en los rsyacios bidimensional y tridinwnsional
Figura 3
La distanciaentre
&
PI y P2 es la normadel vector P I P 2 .
De manera semejante, si P l ( x l , y l ) y P,(x,, -y2) son dos puntos en elespacio
bidimensional, entonces la distancia entre ellos esta dada por
Ejemplo 1 La norma del vector u = (-3, 2, 1) es
/1ul/=
V(
-
3)* + (2)2 + ( 1 ) 2
=
dii
La distancia d entre los puntos P l ( 2 , - 1. -5) y P,(4, - 3 , I ) es
d=V(4-2)2+(-3+ 1)2+(1 + 5 ) * = m = 2 f l
A
Porla definición del producto k u , la longitud del vector ku es k veces la
longitud de u. Expresada como ecuación. esta proposición establece que
Esta útil fórmula se aplica tanto en el espacio tridimensional como en el bidimensional.
EJERCICIOS DE LA SECCIÓN 3.2
3.2 Norma de un vector: aritmética vectorial / I63
3. Sean u = (2, -2, 3), v
= (1,
-3,4), w = (3,6, -4). En cada inciso evaluar la expresión
dada.
a)
l b + VI1
b)
d) Il3u - 5v
+ wl\
e)
IIUII
+ IIVII
c) II - 4
1 + 2llull
1
"w
llwll
4. Sea v= (- 1,2, 5). Encontrar todos los escalares k tales que1 1 k v 1 1 = 4
5. Sean u = (7, -3, l), v = (9, 6,6), w = (2, 1, -S), k = -2 y I = 5. Comprobar que estos
en el teorema3.2.l .
vectores y escalares satisfacen las igualdades expresadas
inciso b).
inciso b)
e).
c) incison.
inciso d)
g).
a)
6. a) Demostrar que si v es cualquier vector diferente de cero, entonces
1
"v
llvll
es un vector unitario.
b) Usar el resultado del incisoa) para encontrar un vector unitario que tenga la misma
dirección que el vector v= (3,4).
c) Usar el resultado del inciso a) para encontrar un vector unitario cuya dirección sea
opuesta a la del vector v = (-2, 3 , -6).
7. a) Demostrar que las componentes del vector v = (vl, vz) en la figura 4 son v1 = llvll
cos 8 y v 2 = llvll sen B.
b) Scan u y v los vectores de la figura 5. Usar el resultado del inciso a) para encontrar
las componentes de4u - 5v.
AY
,"".
,
\
Figura 4
x, y , 2). Describir
Figura 5
el conjunto de todos los puntos (x, y, z )
9. Demostrar geométricamente que si u y v son vectores en el espacio bidimensionalo en
el espacio tndimensional, entoncesIlu + vll
10.
Illull+
Ilvll.
Demostrar analíticamentelos incisos a),c ) y e ) del teorema 3.2.1.
I64 i Vectores en los espacios bidimensional y tridimensional
11. Demostrar analíticamente los incisos
d). g ) y h ) del teorema 3.2.1.
12. Demostrar geométricamente el incison del teorema 3.2.1.
3.3 PRODUCTO PUNTO: PROYECCIONES
En esta sección se analizará un método para multiplicar vectores enlos espacios
bidimensional o tridimensional y se proporcionarán algunas aplicacionesde esta
multiplicación a la geometría.
PRODUCTO
PUNTO DE
VECTORES
Sean u y v dos vectores diferentes de cero en el espacio bidimensional o en el
espacio trilmensional, y suponer que estos vectores se colocan de modo que sus
puntos iniciales coinciden. Por ángulo entre u y v se entiende el ángulo 6 determinado por u y v que satisface O I 6 I TC (figura 1).
IEI ángulo O entre u y v satisface a O'
Figura P
S
O
S
n.
1
~
Definición. Si u y v son vectores en el espaciobidimensional o el espacio
tridimensional y 8 es el ángulo entre u y v, entonces el producto punto o
producto interior euclidianou . Y se define como
u.v
JJullJJvJj
cos 6
=
si u f O y v # O
siu=O o v = O
Ejemplo 1 Como se muestra en la figura 2, el ángulo entre los vectores u = (O, O,
1) y v = (O, 2, 2) es 45O. Así,
3.3 Producto punto: proyecciones / 165
Figura 2
Y
Para efectosde cálculo es deseable contar con una fórmula que exprese elproducto
punto de
dos
vectores
en
términos de las componentes de los vectores. La fórmula
se obtendrá para vectores en el espacio tridimensional; la obtención para vectores
en el espacio
bidimensional
es
semejante.
Sean u = (ul, u2, u3) y v = (vl, v2, v3) dos
vectores diferentes de cero. Si,
como se muestraen la figura 3, 8 es el ángulo entre u y v, entonces la ley delos
cosenos da
FORMULA DE
LAS
COMPONENTES
PARA EL
PRODUCTO
PUNTQ
Figura 3
x/
"*
Como PQ = v - u, (2) se puede volver a escribir como
"
.
.,,". _.
166 / Vectores en los espacios bidimensional
y tridimensional
Y
IIV
-u112 = (VI -u#
+ (v2 -u2)2 + (v3 -u3)2
después desimplificar se obtiene
L
u v = U I V l+ u2v2 + u3v3
Si u = (ul, uz) y v = (vl, v2) son dosvectores en el espacio bidimensional, entonces
la fórmula correspondiente es
CÁLCULO DEL
ÁNGULO ENTRE
VECTORES
Si u y v son vectores diferentes de cero, entonces la fórmula (1) se puede escribir
como
Ejemplo 2 Considerar los vectores
u = (2, -1, 1) y v = (1, 1, 2)
Encontrar u . v y determinar el ángulo 8 entre u y v.
Solución.
u . v = U I V l+ u2v2+ u3v3 = (2)(1) + (1)(2) = 3
Para los vectores dados se tiene IIuII= llvll=
& , de modo que por (5)
Así, 8 = 60°. A
Ejemplo 3 Encontrar el ángulo entre una diagonal de
aristas.
un cubo y una de sus
Solución. Sea k la longtud de UM arista, y se introduce un sistemade coordenadas comose muestra enl a figura 4.
3.3 Producto punto: proyecciones / I67
Si se hace que u1 = (k, O, O), u2 = (O, k, O) y uj = (O, O, k), entonces el vector
d = (k, k, k ) = u1 + u2 + uj
es una diagonaldel cubo. El ángulo 0 entre d y la arista u1 satisface
Así,
El siguiente teorema muestra cómosepuede usar elproducto punto para
obtenerinformación sobreel ángulo entre dos vectores; también establece una
importante relación entre la norma y el producto punto
Teorema 3.3.1. Sean u y v vectores en el espacio bidimensional o el espacio
tridimensional.
a ) v . v = llv11*; es decir, ( ( v ( J(v
= . v)''~.
b ) Si los vectores u y v son diferentes de cero y 0 es el angulo entre ellos, entonces
0 es agudo
0 es obtuso
0 = nf2
si y sólo si
si y sólo s1
si y sólo si
U'V>O.
u.v<O.
u.v=O.
Demostración de a). Como el á n a o 0 entre v y v es O, se tiene
v * v = llvll llvll
COS 6 =
/ VI/'
COS
O = llvlI2
Demostración de b). Como 8 satisface, 0 1 O 1 n,se concluye que: 0 es agudo si y
sólo si cos 0 > O; 0 es obtuso si y sólo si cos < O; y 0 = n l 2 si y sólo si cos O = O.
Pero cos 0 tiene el mismo signo que u . v ya que u . Y = I(u(( llvll cos O, llull > O y
Ilvll> O. Así, se concluye el resultado. @
I68 / Vectores en los espacios bidimensional y tn'dimensional
Ejemplo 4 Si u = (1, -2, 3), v = (-3,4, 2) y w = (3,6, 3), entonces
-5
~-~=(1)(-3)+(-2)(4)+(3)(2)=
+ (2)(3) = 2 1
w = (1)(3) + ( - 2)(6) + (3)(3) = O
v w = ( - 3)(3) + (4)(6)
U
Por consiguiente, u y v forman un ángulo obtuso, v.y w forman un ángulo agudo y
u y w son perpendiculares. A
VECTORES
ORTOGONALES
Los vectores perpendiculares también se denominan vectores ortogonales. A la
luz del teorema 1.3.lb, dos vectores dqerentes de cero son ortogonales si y sólo si
su producto punto es cero. Si se acuerda en considerar a u y v como perpendiculares cuando alguno o los dos son cero, entonces se puede afirmar sin excepción
que dos vectores u y v son ortogonales (uerpendiculares) si y sólo si u v
Para indicar que u y v son vectores ortogonales, se escribe u I v.
Ejemplo 5 Demostrarqueen
el espaciobidimensional, el vector n
Merente de cero es perpendicular a la recta M: + by + c = O.
=
= (a,
O.
b)
Solución. Sean P , ( x l , yl) y P2(x2, y z ) dos puntos dferentes que pertenecen a la
recta dada, de modo que
ax, + byl
ax2
+c =O
+ by2 + c = o
A
Como el vector P I P 2 = (xz - x,, y2 - y l ) está a lo largo de la recta' (figura 5),
basta demostrar quen y
son perpendiculares. Pero al restar las ecuaciones en
q2
(6) se obtiene
que puede representarse en la forma
A
-
(a,b).(x,-x,,y,-y,)=O
Así, n y P I P , son perpendiculares. A
JY
ax+by+c=O
Figura 5
o
n.P,P2=0
3.3 Producto punto: proyecciones / I69
En el siguiente teorema se enumeran las propiedades más importantes del
producto punto. Estaspropiedades son de utilidad en los cálculos donde intervienen vectores.
Teorema 3.3.2. Si u, Y y w son vectores en el espacio bidimensional o en el
espacio tridimensionaly k es cualquier escalar, entonces:
a) u . v = v . u
b) u . ( v + w ) = u - v + u * w
c) k(u.v)= (ku).v= u.(kv)
d)v.v>Osiv#O, y v.v=Osiv=O
Demostración. Se demostrará c ) para vectores en el espacio tridimensional, y las
demás demostraciones se dejan como ejercicio. Sean u = (u1, u2, u3) y v = (vl, v2,
v3); entonces
k(u .v) = k(ulvI
=(
+ U ~ U Z+ ~
3 ~ 3 )
b ) v ,+ (ku,)v, + (ku3)7J3
= (ku). v
De manera semejante,
PROYECCIONES
ORTOGONALES
En muchas aplicaciones se desea"descomponer"un vector u enunaadición de
dossumandos, uno paralelo a unvector específico diferente de cero a y elotro
perpendicular a a. Si u y a se colocan de modo que sus puntos iniciales coincidan
en un punto(2,entonces esposible descomponer el vector u como sigue (figura 6):
Trazar una perpenhcular desde la punta de u hasta la recta que pasa por a, y
obtener el vector w 1 que va de Q al pie de esta perpendicular. Luego, formar la
diferencia
w 2 = u - w1
Figura 6
El vector u es l a suma de w , y w2, donde w, es paralelo a a y w2 es
perpendicular a a.
Como se indica en la figura 6, el vector w1 es paralelo a a, el vector w2 es perpendicular a a, y
I 7 0 / Vectores en los espacios bidimensional y tridimensional
w,+w,=w,+(u-ww,)=u
El vector w1 se denomina proyección ortogonal de u sobre a, o algunas veces.
componente vectorial deu a lo Largo de a. Se denota por
P'OY,
u
(7)
El vector w2 se denomina componente vectorial de u ortogonal a a. Comose
tiene que w2 = u - w l , este vector se puede escribir en notación (7) como
w2 = u - proy, u
En el siguiente teorema se proporcionan fórmulas para calcular los vectores
proy, u y u - proy, u.
Teorema 3.3.3. Si u yason vectores en el espaciobidimensional o enel
espacio tridimensionaly si a f O, entonces
(componente vectorial
de u a lo largo de a)
u.a
u -proya u = u -?a
Itall
(componente vectorial
de u ortogonal a a)
Demostración. Sean w1 = proy, u y w2 = u - proy, u. Como w1 es paralelo a a,
debe ser un múltiplo escalar de a, de modo que se puede escribir en la forma w 1 =
ka. Así,
u=w,+w,=ka+w,
(8)
Tomando el productopuntoen ambos miembros de (8) con a y aplicando los
teoremas 3.3.1a y 3.3.2 se obtiene
-
u a = (ka + w2) a = klJa112+ w2. a
Pero w2 a = O, ya que w2 es perpendicular a a; de modo que (9) produce
k = -u s a
lla1I2
Como proya u = w 1 = ka, se obtiene
(9)
3.3 Producto punto: proyecciones / 171
Ejemplo 6 Sean u = (2, - 1, 3) y v = (4, - 1, 2). Encontrarlacomponente
vectorial de u a lo largo de a y la componente vectorial de u ortogonal a a.
Solución.
-
+ ( - 1)( - 1) + (3)(2) = 15
+ ( - 112 + 22 = 21
u a = (2)(4)
lla1I2 = 42
Así, la componentevectorial de u a lo largo de a es
u-a
a = g(4, - 1,2) = (y, - 47 3 'o)
7
llall
proya u = y
y la componentevectorial de u ortogonal a a es
Como verificación, el lector puede comprobar que los vectores u - proya u y a son
perpendiculares si demuestra que su producto punto es cero. A
Una fórmula para calcular la longitud de la componente vectorial de u a lo
largo de a se puede obtener escribiendo
con lo que se obtiene
I
Si 8 es el á n a o entre u y a, entonces u . a = 1 1 ~ 1 1 llall cos 8, de modo que (IO)
también puedeescribirse como
(Comprobar.) UM interpretación geométrica de este resultado se proporciona enl a
figura 7.
I72 / Vectores enlos espacios bidimensional y tridimensional
Figura 7
OSO<-
7r
7T
--< e
2
2
s
Como ejemplo, se usarán métodos vectoriales en la obtención de una fórmula
para calcular la distancia de un punto enel plano a una recta.
Ejemplo 7 Encontrarunafórmulapara
Po(xo,y,, 2,) y la recta ax + by + c = O.
calcular la dstancia D entre el punto
Solución. Sea Q(x,, y l ) cualquier punto en la recta, y el vector
n = (u, h )
se coloca de modo que su punto inicial esté en Q.
Por el ejemplo 5, el vector n es perpendicular a la recta (figura S). Como se
indica
en la figura. la distancia D es igual a la longitudde la proyección ortogonal
+
de QPo sobre n; así, por (lo), se tiene que
Pero
1
‘y+by+c=O?
Figura 8
de modo que
3.3 Producto punto: proyecciones / I 73
(I(.,,
Dadoque el punto
yl) está sobre la recta, sus coordenadas satisfacen la
ecuación deésta, de modo que
aX1+by1+c=O
o bien,
c = -ax1 - by,
Al sustituir esta expresión en(12) se obtiene la fórmula
Ejemplo 8 Por la fórmula (15) se concluye que la distancia D del punto (1, -2) a
la recta 3x + 4y - 6 = O es
D=
1(3)(1)+4(-2)-6\
d m
-
1-111
11
a
5
EJERCICIOS DE LA SECCIÓN 3.3
1.
Encontrar u . v.
a) u = (2, 3), v = (5, -7)
b) U = ( - 6, - 2), v = (4, O)
C) ~ = ( l -, 5 , 4 ) ,~ = ( 3 , 3 , 3 )d ) ~ = ( - 2 , 2 , 3 ) ,~ = ( 1 , 7 ,
-4)
2. En cada inciso del ejercicio1, encontrar el coseno del ángulo entreu y Y
3.
Determinar siu y v forman un ángulo agudo,un ángulo obtusoo son ortogonales.
a> u = ( 6 , 1 , 4 ) v, = ( 2 , 0 -, 3 )b ) u = ( O , O ,
- I ) , v = ( l , 1, 1)
c>u=(-6,0,4), ~ = ( 3 , 1 , 6 )
d ) ~ = ( 2 , 4 ,-8), ~ = ( 5 , 3 , 7 )
4. Encontrar la proyección ortogonal de
u sobre a.
a) u = (6, 2), a = (3, -9)
b ) u = ( - 1 , -2), a = ( - 2 , 3 )
c) u = ( 3 , 1 , -7), a = ( l , 0 , 5 )
d)u=(l,O,O), a = ( 4 , 3 , 8 )
5. En cada inciso del ejercicio4, encontrar la componente vectorial deu ortogonal a a
6. En cada inciso, encontrar Ilproy, u 11.
a) u = ( l , -2), a = ( - 4 , - 3 )
b) u = (5, 6), a = (2, - 1)
C) u = (3, O, 4), a = (2, 3, 3)
d) u = ( 3 , -2, 6), a = ( l , 2, -7)
A
I74 / Vectores enlos espacios bidimensional y tridimensional
7.
Sean u = (5, -2, l), v
cantidades.
=
(1, 6, 3) y k
=
-4. Comprobar el teorema
3.3.2 para estas
8. a) Demostrar quev = (a,b ) y w = ( 4
, a) son vectores ortogonales.
b) Usar el resultado del inciso a) para encontrar dos vectores que sean ortogonales a
v = (2, - 3 ) .
c) Encontrar dos vectores unitarios que sean ortogonales(-a3,4).
- 1) y w = (7, 1). Evaluar las expresiones
b) Il(u v)wll
c) IlUlKV . w >
d) (Ilullv)-w
9. Sean u = (3,4), v = (5,
a)
- (7v
+
w)
10. Explicar por qué cada una de las siguientes expresiones carece de sentido.
a) u (v w)
b)
(u v)
+w
c) Ilu
- vII
d) k
(u + v)
11. Usar vectores para hallar los cosenos de 10s ángulos internos del triángulo cuyos vértices son (O, - l), (1, -2) y (4, 1).
12. Demostrar que 4 3 , O, 2), B(4, 3, O) y C(8, 1, -1) son los vértices de un triángulo
rectángulo. ¿En qué vértice está elángulo recto?
13. Suponer que a
14.
b=a
c
y a # O. $,e
concluye que b = c? Explicar la respuesta
Sean p = (2, k ) y q = (3, 5). Encontrar k tal que
a) p y q sean paralelos.
b) p y q sean ortogonales.
c) el ángulo entre p y q sea d 3 .
d) el ángulo entre p y q sea n/4.
15. Usar la fórmula (13) para calcular la distancia entre el punto
y la recta.
a) 4x+3y+4=0;(-3, 1)
+ 2; (2, -5)
b) y = - 4 ~
c) 3x+y=5;(1,8)
16. Establecer la identidad Ilu + vJ12+ IIu - v1I2 = 2 lu112+ 2
17. Establecer la identidad u * v =
)l~11~.
f 11u + v)12- f 1111 - ~ 1 1 ~ .
18. Encontrim el ángulo entre una diagonal de un cubo
y una de sus caras.
19. Sean i, j y k vectores unitarios a lo largo delos ejes positivos x, y y z de un sistema de
coordenadas rectangulares en el espacio tridimensional. Si v = (a, b, c ) es un vector
diferente de cero, entonces los ángulos a, f i , y y entre v y los vectores i, j y k, respectivamente, se denominan cfngulos directores de v (figura 9), y los números cos a ,
cos y cos y se denominan cosenos directores de v
a) Demostrar que cos a = a/ IIvII.
b) Encontrar cosfi y cos y.
c) Demostrar que v/llvll= (cos a , cosa , cos y).
d) Demostrar que cos2 a + cos2/3 + cos2y = l .
Figura 9
3.4 Producto cruz / 175
20. Usar el resultado del ejercicio 19 para calcular, hasta el grado más próximo, los
ángulos que forma una diagonal de una caja de dimensiones 10 cm
X 15 cm X 25 cm con
las aristas dela caja. [Nota Se requiere una calculadorao tablas trigonométncas.]
21.
Con referencia al ejercicio19, demostrar quev1y v, son vectores perpendiculares en el
espacio tndimensional siy sólo si sus cosenos dlrectores satisfacen
cos
0:
1
cos
4,
+ cosp, cos p, + cos y, cos y,
=o
22. Demostrar quesi v es ortogonal tanto aw ,como a w2, entonces v es ortogonal ak,wl+
k2w2para todos los escalaresk, y k,.
23. Sean u y v vectores diferentes de cero en el espacio bidimensional
o en el espacio
tridimensional, y sean k = 1 1 ~ 1 1 y I = IIvII. Demostrar que el vectorw = lu + kv biseca el
ángulo entre u y v.
3.4 PRODUCTO CRUZ
En muchas aplicaciones de vectores a problemas de geometría, fisica e ingeniería
es de interés construir en el espacio tridimensional un vector que sea perpendicular a dos vectores dados. En esta sección se introducirá un tipo de multiplicación vectorial conque se obtiene ese vector.
DE VECToRES
Definición. Si u = ( u l , u*, u3) y v = ( v ~v2,
, v3) son vectores enel espacio
tridimensional, entonces el producto cruz u X v es el vector definido por
1 o,
en notación de determinantes,
oBsERvACIóN. En vez dememorizar (l), las componentes de u x v se pueden
obtener como sigue:
Se forma la matriz 2
X
3
cuyoprimer renglón contiene las componentes de u y cuyo segundo renglón contiene las componentes dev.
176 / Vectores en los espacios bidimensional y tridimensional
Para encontrar la primera componente de u X v, eliminar la primera columna y evaluar el determinante; para encontrar la segunda componente, eliminar la segunda columna y evaluar el negatiTlo del determinante; para encontrar la terceracomponente,eliminarlaterceracolumna
y evaluar eldeterminante.
Ejemplo 1 Encontrar u x v, donde u = (1, 2, -2) y v = ( 3 , O, 1)
Solución
Existe una diferencia importante entre el producto punto y el producto cruz
de dos vectores: el producto punto es un escalar y el producto cruz es unvector. El
siguiente teorema proporciona algunas relaciones importantes entre elproducto
punto y el producto cruz,y también muestra queu x v es ortogonal tanto a u como a v.
Teorema 3.4.1, Si u, v y w son vectores en el espacio tridimensional, entonces
a) u.(uXv)=O
b) v . ( u X v ) = O
(u X Y
es ortogonal
a u)
(u X v es ortogonul a
v)
( u ~ v ) ~ (IdentzdaddeLagrunge)*
d ) u X (v X w) = (u. w)v - (u. v)w (relucidn entre los productos cruzypunto)
e ) (U X V) X w = (u w)v - (V W)U (relación entre los productos cruz ypunto)
C)
[ / U X V112 = 11U/1* l/v/l2-
-
I
*Joseph Louis Lagrunge (1736-1813). Matemático y astrónomo francés-italiano. Lagrange, hijo
de un funcionario público, nació en Turin, Italia. (En el registro bautismal su nombre aparece como
GiuseppeLodovicoLagrangia.)Aunquesupadrequeríaquefueseabogado,Lagrangesesintió
atraído por las matemáticas y la astronomia después de leer una memoria del astrónomo Halley. A
los 16 aAos de edad empezó a estudiar matemáticas por
su cuenta y a los 19 h e contratado como
profesor en la Royal Artillery School en Turin. El año siguiente resolvió algunos problemas famosos
aplicando nuevos métodos que florecieron en una rama
de las matemáticas denominada cálculo de
variaciones. Estos métodos y las aplicaciones que Lagrange hizo de éstos a problemas de mecánica
celesteerantanmonumentalesqueaproximadamentea
los 25 años deedadLagrangeyaera
considerado por muchos de sus contemporáneos como el más grande matemático existente. Uno de
los trabajos más famosos de Lagrange es un documento denominado Mécunique Anulyflque, en el
que reduce la teoría
de la mecánica a unas cuantas fórmulas generales a partir
delascualeses
posible derivar todas las demás ecuaciones necesarias.
Eshistóricamenteinteresante
el hechodeque
elpadredeLagrangeincursionóinfrucsu familia estaba obligada a vivir
con
tuosamenteenvariasempresasfinancieras,demodoque
bastante modestia. Lagrange mismo afirmó quesi su familia tuviera dinero, su vocación no hubieran
sido las matemáticas.
Napoleón era un gran admirador de Lagrange y lo cubrió de honores: lo hizo conde, senador y
le otorgó la orden de la Legión de Honor.
A pesar de su fama, Lagrange siempre fue
un hombre
tímido y modesto. A su fallecimiento, h e sepultado con honores en El Panteón parkino.
3.4 Producto cruz / 177
Demostración de a). Sean u = (ul, u2, uz) y v = (v,, v2, v3). Entonces
Demostracibn de b). Semejante a la demostración dea).
La demostraciónse puede completar "multiplicando"los miembros derechosde (2)
y (3 j y comprobando suigualdad.
Demostración de d)y e). Ver los ejercicios 26 y 27.
0
Ejemplo 2 Considerar los vectores
u = (1, 2, -2)
y v = (3, o, 1)
En el ejemplo 1 se demostró que
u X V = ( ~ -7,
, -6)
Como
Y
u x v es ortogonal tanto a u como a v, como garantiza el teorema 3.4. l . A
En el siguiente teorema se enumeran las principales propiedades aritméticas
del producto cruz.
Teorema 3A.2. S i u, v y w son vectores cualesquiera
sional y k P.%cualquier escnlnr. entonces
en
el espacw tridimen-
a) u x v - - ( v X u )
b)
U
x (Y
-1-
W)
(U
x Y) f
(U X W)
6') (U f V ) x W (,Mx W) -t(V x W )
d ) k(u X V) -= ( k ~ X) v -= U X (kv)
e) u x o = Oxu-o
x u ==o
,f) u
~
~
~
_
I
_
_
_
_
_
I
_
Las demostraciones se concluyen de inmediato a partir de la fórmula (1) y de las
propiedades de los determinantes; por ejemplo, a) puede demostrarse corno:
a). Al intercambiar u y v en ( I ) se intercaxnbian los renglones de
los tres determinantes del miembro derecho de (l), y por tanto se cambia el signo
de cada cornpotlerlte en el producto cruz. Así. u X v = -(Y X u). 0
ílcrrwslmt~lcirldc
Las demostraciones de los dem8s incisos se dejan como ejercicio
Ejemplo 3 Considerar los vectores
i
=(I,
O, O)
j
= (O,
!, O)
k = (O, O, 1 j
Cada uno de estos vectorcs tiene longitud igual a 1 y está a lo largo de un eje de
coordenadas (figura 1). Se denominan vectores unitarios normales en el espacio
tridimensional. Todovector v = (v,, v2, v 3 ) en elespacio tridimensional puede
expresarse en términos de i, j. k. ya que es posible escribir
Figura 1
vectores unitarios estándares.
1
Por ejemplo,
(2,
--
3, 4) = 2 i - 3 j + 4k
3.4 Producto cruz / I79
A partir de (1) se obtiene
oj
i
El lector no debe tener ningún problema para obtener los siguientes resulta-
dos:
k
Figura 2
FÓRMNLA DEL
DETERMINANTE
PARA EL
PRODUCTO
CRUZ
iXi=jXj=kXk=O
kj iX
xxikj==j ki ,,
j X i = -k,
k x j = -i,
ixk=
-j
La figura 2 es útil para recordar los resultados anteriores. Con referencia a esta
figura, si la circunferencia se recorre en el sentido del movimiento de las manecillas del reloj, el producto cruz de dos vectores consecutivos es el siguiente vector
que se encuentra, y si se recorre en sentido contrario al movimiento de las manecillas del reloj, el producto c m de dos vectores consecutivos es el negativo del
siguiente vector quese encuentra.
También vale la pena observar que un producto cruz se puede representar simbólicamente en formade un determinante 3 X 3:
Por ejemplo, si u = (1, 2, -2) y v = (3, O, l), entonces
i
uXv= 1
3
j
2
0
k
-2 =2i-7j-6k
1
lo que concuerda conel resultado obtenido en el ejemplo l .
Advertencia. En general, no es cierto que u
ejemplo,
X
(v
X
w)
=
(u
X
v)
X
w. Por
iX(jxj)=iXO=O
Y
( i X , j ) x j = k X j = -i
de modo que
iX(j~j)#(iXj)Xj
Por el teorema 3.4.1 se sabe que u X v es ortogonal tanto a u como a v.
Si u y v son vectores diferentes de cero, es posible demostrar que la dirección
180 / Vecto~es
en los espacios hidinmvional y tridimensional
de u x v se puede determinar aplicando la siguiente "regla de la mano derecha"* (figura 3): Sea 8 el ángulo entre u y v, y suponer que u se hace girar
por el ángulo 8 hasta que coincide con v. Si los dedos de la mano derecha se
disponen de modo que apunten en la dirección de rotación, entonces el pulgar
indica (aproximadamente) la dirección de u X v.
&
u
+
uxv
r
Figura 3
"
'
v
EI lector encontrará instructivo practicar esta regla con los productos
iXj=k
JNTERPRETACIÓN GEOMÉTRICA DEL
PRODUCTO
CRUP
jXk=i
kXi=j
Si u y v son vectores en el espacio tridimensional, entonces la norma de u x v
tiene una interpretación geométrica útil. La identidad de Lagrange, proporcionada
en el teorema 3.4.1, establece que
Si 8 denota el ángulo entre u y v, entonces u . v = llull llvll cos 8 , de modo que (5)
se puede escribir de nuevo como
Así,
Pero llvll sen 8 es la altura del paralelogramo determinadopor u y v (figura 4). Por
tanto,
*Recordar que en este texto se acordó considerar sólo sistemas de coordenadas derechos. En caso de que se
hubieran usado sistemas izquierdos,aquí se hubiera aplicado una "regla de la
mano izquierda".
3.4 Producto cruz / 181
por (6), el área A de este paralelogramo está dada por
A
= (base)(altura)= llull
llvll sen 0 1 / 1 1 x
VI]
Este resultado es correcto inclusive si u y v son colineales, ya que el paralelogramo
determinado por u y v tiene área cero y por (6) se sabe que u x v = O porque en
este caso 8 = O. Por tanto, se tiene el siguiente teorema.
Teorema 3.4.3. Si u y v son vectores en el espacio tridimensional, entonces u
X v es igual al área del paralelogramo determinado por u y v.
Ejemplo 4 Encontrar el área del triángulo determinado por los puntos P I P , 2, o),
P 2 ( - 1. o, 2) y P,(O, 4, 3 ) .
4
El área 4 del tr$ingulo es del área del paralelogramo determinado
por los vectores P I P , y P , P, (figura 5). Usando el método analizado en el ejemplo
2 de la sección 3.1, P I P 2= (-3, -2, 2) y P I P 3= (-2, 2, 3). Se concluye que
Solución.
-
b
P I P , x P I P 3= ( - 10,5,
Figura 5
i
I'
x
-
10)
Pi (2'2. O)
y en consecuencia,
TRIPLE
PRODUCTO
ESCALAR
Definición. Si u, v y w son vectores en el espacio tridimensional, entonces
u (v x w)
se denomina triple producto escalar de u, v y w.
El triple producto escalar de u = (u1, u2, u2), v = ( v l , v2, v2) y w = (wl, w2,
wz) se puede calcular a partir de la fórmula
(7)
WI
w:!
w3,
182 / Vectores en los espacios bidimensional y triditnensional
Lo anterior se concluye porla fórmula (4), ya que
;3iul
-
Ejemplo 5 Calcular el triple producto escalar u (v
Solución.
X
w) de los vectores
Por (7),
1
-2
4
o
3
3
U.(VX
w)
=
-60+4-
-5
-4
2
15149 A
-
O B S E R V A C I ~ X El símbolo (u v) X w carece de sentido, ya que no es posible
formar el producto cruz de un escalar y un vector. Así, no hay ambigüedad si
se escribe u v X w en vez de u (v X w). Sin embargo, por claridad en general se
conservará el paréntesis.
Por (7) se concluye que
u.(vxw)=w.(uxv)=v.(wxu)
W
x
V
Figura 6
INTERPRETACI~N
GEOMÉTRICA DE
LOS
DETERMINANTES
ya que los determinantes 3 x 3 que representan estos productos se pueden obtener
uno a partir de otro mediante dos intercambios en los renglones. (Comprobar.) Es
posible recordar estas relaciones moviendo los vectores u, v y w en el sentido de
las manecillas del reloj alrededor de los vértices del triángulo que se muestra en la
figura 6.
3.4 Producto cruz
183
Teorema 3.4.4.
a ) El valor absoluto del determinante
es igual al área del paralelogramo en el espacio hidimensional dekrtruna
do por los vectores u = (id1, u2) y v = (vl, v2). (Ver la,figura 7a.)
6) El valor absoluto del determinante
es igual al volumen del pordelepípeclo en cl espacio tridinwnsional d~
terminado por los \lectores u = ( u , . u 2 . zr3). v = (v,. v 2 , v3) y w = (w,,w 2 ,
wJ. (Ver la$gura 76.)
Demostración de a).La clave de la demostración es aplicar el teorema 3.4.3. Sin
embargo. este teorema es válidopara vectores en el espacio tridimensional.
mientras que u = (u,. u * ) y v = ( v I . v2). son vectorcs en el espacio bidimensional.
Para superar este "problema de dimenslon". u y v se considerarán como vectores
en el plano xv de un sistema de coordenadas xyz (figura sa), en cuyo caso estos
vectores se expresan como u = (u1. u 2 . O) y v = ( v l . v2, O). Así.
Ahora, por el teorema 3.1.3 y el hecho de que Ilk11 = 1. se concluye quc el área A
del paralelogramo determinado poru y v es
Figura 7
u1
184 / Vectores en los espacios bidimensional y tridimensional
con lo que se completa la demostración.
Demostración de b). Como se observa en la figura 86, se considera que la base del
paralelepípedo determinado por u, v y w es el paralelogramo determinado por u y
v. De acuerdo con el teorema 3.4.3 se concluye que el área de la base es IIv X wII
y, como se ilustra en lafigura 86, la alturah
I
Y
L
Figura 8
nl
del paralelepípedo es la longitud de la proyección ortogonal de u sobre v x w. En
consecuencia, por la fórmula (10) de la sección 3.3,
Se concluye que el volumen V del paralelepipedo es
con lo que se completa la demostración. 0
OBSERVACI~N. Si V denota el volumen del paralelepípedo determinado por los
vectores u, v y w, entonces por el teorema 3.4.4 y la fórmula (7) se concluye que
3.4 Producto cruz / 185
1
volumen del paralelepípedo
= /u (v x w>l
detemunado poru, v y w
Con base en este hecho y en el teorema 3.3.16 se puede deducir que
u.(vXw)= kv
donde el signo + o -resulta si u forma un ángulo agudo U obtuso con v X W .
La fórmula (8) conduce a una prueba útil para averiguar si tres vectores
dados son coplanares. Como tres vectores no coplanares determinan un paralelepípedo de volumen positivo, por (8) se concluye que 1u * (v X w)l = O si y sólo si
los vectores u, v y w son coplanares. Así, se tiene el siguiente resultado.
~~
~~
~
Teorema 3.4.5. Si los vectores u = ( u l , u2, u3), v = ( v l ,v2, v3)y w = (wl, w2,
w3)tienen el mismo punto inicial, entonces están en el mismo plano si y solo si
INDEPENDENCIA
DEL PRODUCTO
CRUZ Y DE LAS
COORDENADAS
Inicialmente, se definió a un vector como un segmento de recta duigido o una
flecha en el espacio bidimensional o en el espacio tridimensional; los sistemas de
coordenadas y las componentes se introdujeron después para simpllficar los
cálculos con vectores. Así, un vector posee "existencia matemática" sin importar
si se ha introducido en un sistema de coordenadas. Además, las componentes de
un vector no están determinadas solamente por el vector; también dependen del
sistema decoordenadaselegido. Por ejemplo, en la figura 9 se indican un
vector fijo v en el plano y dos sistemas de coordenadas diferentes. En el sistema
de coordenadas x y , las componentes de v son (I, 1) y en el sistema x y , son
( J z , o ).
Este hecho plantea una cuestión importante sobre la definición de producto
cruz. Como el producto cruz u X v se definió en términos de las componentes de u
y v ycomo estas componentes dependen del sistema de coordenadas elegido,
parece posible que dos vectoresfjos u y v puedan tener productos cruz distintos en
sistemas de coordenadas diferentes. Afortunadamente, no sucede así. Para ver lo
anterior, simplemente basta recordar que
u X v es perpendicular tanto a u como a v.
La orientación de u X v está determinada por la regla de la mano derecha.
l b x VI1 = llull llvll sen 8.
186 / Vectores en los espacios hidimensioml J; tridirnensionul
Estas tres propiedades determinan completamente elvector M X v; las dos
primeras propiedades determinan la direccih y la tercera determina la longitud.
Como estas propiedades de u X v dependen shlo de las longitudes y posiciones
relativas de u y v no del sistema de coordenadas derecho particular que se esté
usando, elvector u X v permanece sin cambio si se introduce un sistema de
coordenadas derecho diferente. Así, se dice que l a definición de M X v es independiente de las coordenadas. Este resultado es importante para los fisicos e ingenieros, quienes a menudo trabajan con muchos sistemas de coordenadas en el mismo
problema.
Figura 9
Ejemplo 4 Considerar dos vectores perpendiculares u y ti, cada uno de longitud 1
(como se muestra en la figura IOU). Si se introduce un sistema de coordenadas xyz
como se muestra en la figura 1 Oh, entonces
de modo que
Sin embargo, si se introduce un sistema de coordenadas rlv'z' como se muestra en
la figura 1Oc. entonces
de modo que
3.4 Producto cruz / 187
u X v = k X i = j = ( O , 1,0)
Pero por las figuras 106 y 1Oc es evidente que el vector (O, O, 1) en el sistema xyz
es el mismo que el vector (O, 1, O) en el sistema x'y'z'. Así, se obtiene el mismo
vector u x v si los cálculos se realizan con coordenadas del sistema xyz o con
coordenadas del sistema x'y'z'. A
EJERCICIOS DE LA SECCIóN 3.4
1. Sean u = (3,2, - I ) , v = (O, 2, -3) y w = (2,6,7). Calcular
b) u X (v X w)
a) v X w
c) (u x v) x w
e ) u X (v - 2w)
f ) (u X v) - 2w
d) (u X v) X (v X w)
2. Encontrar un vector que sea ortogonal tanto a u como a v.
a) ~ = ( - 6 , 4 , 2 ) , v = ( 3 ,
1,5)
b) ~ = ( - 2 , 1, 5), ~ = ( 3 , 0 ,-3)
3. Encontrar el área del paralelogramo determinado por u y v.
a) u = ( l , - 1 , 2 )v, = ( O , 3 .
1)
b) u = ( 2 , 3 , 0 ) v, = ( - 1 , 2 -, 2 )
C) U = (3, - 1, 4), v = (6, -2, 8)
5. Comprobar el teorema 3.4.1 para los vectores u = (4,2, 1) y v =( -3,2, 7)
6 . Comprobar el teorema 3.4.2 para u = (5, -1, 2), v = (6, O, -2), w
k = -5.
=
(1, 2, -1) y
7. ¿Cuál es el error en la expresión u x v x w?
8. Encontrar el triple producto escalar u . (v X w).
a ) u = ( - l , 2 , 4 ) , v = ( 3 , 4 , -2), w = ( - 1 , 2 , 5 )
b ) u = ( 3 , - 1 , 6 ) , ~ = ( 2 , 4 , 3 ) , ~ = ( 5 ,- I , 2 )
9. Suponer que u . (v x w) = 3. Encontrar
a) u - ( w X v )
b) ( v X w ) - u
C)
w-(uxv)
d) v . ( u x w )
e) ( u x w ) . ~
f) v.(wxw)
10. Encontrar el volumen del paralelepípedo cuyos lados son u, Y, y w.
a)
= (2,
- 6 , 2), v = (O, 4, -2),
w =
(2,2, -4)
b)
U =
(3, I , 2), v
=
(4, 5 , I), w = (1, 2, 4)
11. Determinar si u, v, y w son coplanares cuando se colocan de modo que coincidan sus
puntos iniciales.
a) u = ( - 1, -2, I), v = (3, O, - 2 ) w = (5, -4, O)
b ) u = ( 5 , -2, I), ~ = ( 4 -,I , I ) , w = ( l , - I , O )
C) U =(4, -8, I ) , v = ( 2 , 1, -2), w
(3, -4, 12)
12. Encontrar todos los vectores unitarios paralelos al plano xy que son perpendiculares al
vector (3, - 1,2).
I88 / Vectores enlos espacios bidimensional y tridimensional
13. Encontrar todos los vectores unitarios en el plano determinado por u = (3, O, 1) y v =
(1, - 1, 1 ) que son perpendiculares al vector w = (1,2, O).
14. Sean a = ( a , ,a2,a3),h = ( b , , h2, h i ) , c = ( c , ,c2, C J y d = (di, d,, d3).Demostrar que
(a+d).(bXc)==a.(bXc)+d-(bXc)
15. Simplificar (u + v) X (u - v )
16. IJsar el producto cruz para encontrar el seno del ángulo entre los vectores u = (2,
3, -6) y v = (2, 3,6)
17. a ) Encontrar el área del triángulo cuyos vértices son A(1, O, I ) , B(O,2, 3 ) y C(2, 1, O).
b) IJsar el resultado del inciso a) para encontrar la longitud de la altura del vértice ¿' al
lado AH.
18. Demostrar que si u es un vector que va de cualquier punto de una recta a un punto 1'
que no pertenece a la recta y v es un vector paralelo a Csta, entonces la distancia entre
P y la recta está definida por 1111 X vII / Ilvll.
21. Considerar el paralelepípedo con lados u = (3,2, I), v = (1, 1,2) pw = ( I , 3 , 3).
a) Encontrar el área de la cara determinada por u y w .
b) Encontrar el ánguio entre u y el plano que contiene la cara determinada por v y w.
[Nota El ángulo entre un vector y un plano se define como el Angulo O entre el
vector y la nonnal al plano para la que O .c- O S d 2 . 1
22. Encontrar un vector n perpendicular al plano determinado por los puntos A(0, -2, I),
& I , -1, -2) y (?(--I, 2, O). [Ver la nota del ejercicio 21.1
23. Sean m y n vectores cuyas componentes en el sistema xyz de la figura IO son m = (O, O,
1)y n = ( O , I , O).
a) Encontrar las componentes de m y n en el plano xyz' de la figura 1O.
b) Calcular m X n usando las componentes del sistema q z .
c) Calcular m X n usando las componentes del sistema xyz'.
d) Demostrar que los vectores obtenidos en b) y c) son los mismos.
24. Demostrar las siguientes identidades
a) ( u + k v ) ~ v = u X v
b) U . ( V X Z ) =" ( u x z ) . ~
25. Sean u, v y w vectores diferentes de cero en el espacio tridimensional que tienen el
mismo punto inicial, pero de modo que ningún par de ellos es colineal. Demostrar que
a) u X (v X w) está en el plano determinado por v y w.
b) (u X v) X w estri en el plano determinado por u y v
3.5 Rectas y planos en el espacio tridimensional / 189
26. Demostrar el inciso 6)del teorema 3.4.1. [Sugerencia Demostrar primero el resultado
en el caso en que w = i = (1, O, O), luego cuando w = j = (O, 1, O) y luego cuando w = k
= (O, O, 1). Por Cltimo, hacer la demostración para un vector cualesquiera w = (w,,wz,
w3)escribiendo w = w,i + wzj + w3k.]
27. Demostrar el inciso e ) del teorema 3.4.1. [Sugerencia Aplicar el inciso a) del teorema
3.4.2 al resultado del inciso d) del teorema 3.4.1.1
28. Sean u = (1, 3, -l), v = (1, 1,2) y w = (3, -1, 2). Calcular u x (v X W) usando el
ejercicio 26; luego, comprobar el resultado efectuando el cálculo directamente.
29. Demostrar: Si a, b, c y d están el mismo plano, entonces (a
X
b) x (c
X d)
= O.
30. En geometría de sólidos existe un teorema que establece que el volumen de un tetrae-
dro es 1/3(área de la base) * (altura). Usar este resultado para demostrar que el volumen del tetraedro cuyos lados son los vectores a, b y c es 116 ::. (b X c) (figura 11).
31. Usar el resultado del ejercicio 30 para encontrar el volumen del tetraedro con vértices
P,Q, R Y S.
a) P ( - 1, 2, O), Q(2, 1, -31, 4 1 , O, 11, S(3, -2, 3)
b) P(0, O, O), Q(1, 2 , - I ) , R(3,4, O), S ( - 1, -3, 4)
32. Demostrar los incisos a ) y 6 ) del teorema 3.4.2
33. Demostrar los incisos c) y 6)del teorema 3.4.2.
34. Demostrar los incisos e ) y j ) del teorema 3.4.2
3.5 RECTAS Y PLANOS EN EL ESPACIO TRIDIMENSIONAL
En esta sección se usarán los vectores para obtener ecuaciones de rectas y planos
en elespacio tridimensional, y estas ecuaciones se utilizarán para resolver
algunos prob lemas de geometría básicos.
PLANOS EN EL
ESPACIO
TRIDIMENSIONAL
En geometría analítica plana, una recta se puede especificar dmdo su pendiente y
uno de sus puntos. De manera semejante, un plano en el espacio tridimensional se
puede especificar proporcionando su inclinación y especificando uno de sus puntos.
Un
método
conveniente para describir la inclinación es especificar un vector
diferente de cero (denominado normal) que es perpendicular al plano.
I90 / Vectvres en los espacios bidimensiorraly tridinrensisional
Suponer que se desea encontrar la ecuación del plano que pasa por el punto
Po(xo,yo,zo) y cuya normal es el vector n = (a, b, e) diferente de cero. De la figura
1 resulta evidente que el plano consta precisamente de los puntos P(x, y , z ) para
T
6 es ortogonal a n; es decir,
los cuales el vector P
“-----f
n.PoP=O
4
Como POP= (x - xo. y - yo, z - zo). la ecuación (1) se puede escribir como
La expresión (2) se denomina forma punto-normal de la ecuación de un plano.
Figura 1
x/
Ejemplo 1 Encontrar la ecuación del plano que pasa por el punto ( 3 , - 1, 7) y es
perpendicular al vector n = (4, 2. -5).
Multiplicando y agrupando téminos, (2) puede volver a escribirse como
donde a, 6 , c y d son constantes y no todas las constantes u, b y c son iguales a
cero. Así, la ecuación en el ejemplo 1 se puede escribir de nuevo como
4x + 2y
- 5~ + 25 = O
Como se demuestra en el siguente teorema, toda ecuación de la forma ax + by +
cz + d = O representa un plano en el espacio tridimensional.
3.5 Rectas y planos enel espacio nidimensional / 191
son iguales
Si a, b, c y d son constantes y no todas las constantes a, b y c
a cero, entoncesla grájca de la ecuación
1
ax+by+cz+d=O
es un plano cuya normal es el vector n = (a, 6, c).
La ecuación (3) es una ecuación lineal en x, y y z; se denomina forma
general de la ecuación delplano.
Demostración. Por hipótesis, notodos los coeficientes a, b y c son iguales a
cero. Suponer, por el momento,que a # O. Entonces la ecuación ax + by + cz + d =
O puede escribir de nuevo en la forma a(x + (d/a))+ by + cz = O . Pero esta es una
forma punto-normal del plano que pasa por el punto (-d/a, O , O) y cuya normal es
n = (a,6, c).
Si a = O, entonces b # O o c # O. Una modificación directa del razonamiento
anterior permite manejar estos otros casos. 0
De la misma manera en que la solución deun sistema de ecuaciones
ax
+ by = k,
cx
+ dy = k2
lineales corresponde a los puntos de intersección de las rectas ax + by
dy = k, en el plano x y , así las soluciones de unsistema
ax + by + cz = k ,
dx + ey + fz = k ,
gx + hy + iz = k3
= k,
y cx +
(4)
corresponden a los puntos de intersección de los tres planos ax + by + cz = k , , dx +
ey+&=k2ygx+hy+iz=k3.
En la figura 2 se ilustran algunas de las posibilidades geométricas que
ocurren cuando (4) no tiene solución, tiene exactamente una solución o tiene
infinidad de soluciones.
Ejemplo 2 Encontrar la ecuación del plano que pasa por los puntos Pl(l, 2, - l),
P , ( 2 , 3 , 1) y P,(3, - L 2 ) .
Solución. Como los tres puntos están en el plano, sus coordenadas deben satisfacer
la ecuación general ax + by + cz + d = O del plano. Así,
a+2b2a+3b+
c+d=O
c+d=O
3 ~ -b + 2 c + d = O
192 / Vectores en los espacios bidimensional y tridimensional
La solución de este sistema es
a=
- A1 t6 ,
h = " I1 6t ,
c=&t,
d=l
solución(3 planos paralelos).15)No existe solución(2 planos paralelos).
c) No existe solución(3 planos sin intersección común).
d) Infinidad de soluciones (3
planos coincidentes). e) Infinidad de soluciones(3 planos que se intersecan en una
&).A Una solución (3 planos quese cortan en un punto).g) No existe solución(2
planos coincidentes paralelos un
a tercer plano).h) h f h d a d de soluciones( 2 planos
coincidentes quese intersecan con un tercer plano).
a) No existe
Figura 2
~~
Haciendo t = - 16, por ejemplo, se obtiene la ecuación buscada
9x+y
- 5~ - 1 6 = 0
Se observa que con cualquier otra elección de t se obtiene un múltiplo de esta
ecuación, de modo que con cualquier valor de t f O también se obtiene una ecuación válida del plano.
-
Otra solucion. Como P l ( l , 2, - l ) , P2(2,3, 1) y P3(3, -1, 2) pertenecen al plano,
entonces los vectores
p p = (1, 1, 2) y P I P 3 = (2, -3, 3) son paralelos al plano.
u'2
Por consiguente, P I P 2 x P I P , = (9, 1, -5) es normal al plano, ya que es
perpendicular a pip; y a p , P,. Con base en este hecho y como P, pertenece al
plano, una forma punto-normal para la ecuación del plano es
__f
-
&
9(x - 1)
+ ( y - 2) - 5(z + 1) = O
O
~ x + Y - ~ z 1- 6 - 0
A
3.5 Rectas y planos en el espacio tndimensional / I Y3
FORMA
VECTORLAL DE
LA ECUACI6N
DE UN PLANO
Figura 3
La
notación
vectorial
proporciona
otra
manera
útil para
escribir
la
punto-normal de la ecuación de un plano; con referencia a la figura 3,
= (x, y , z) el vector que va del origen
al punto P ( x , y , z), r, = (x,, y,,
vectorque va delorigenalpunto
P,(x,, y,, z,), y n = (u, b, c) un
normal al plano (figura 3).
forma
sean r
zo) el
vector
x+’
Entonces PTP
como
=
r - r,, de modo que la fórmula (1) se puede volver a escribir
I
n (r - r,,) = O
Esta expresión se denominaforma vectorial dela ecuación deun plano.
Ejemplo 3 La ecuación
esla ecuación vectorialdel plano que pasaporel
pendicular al vector u = (- 1, 2, 5). A
RECTAS EN EL
ESPACIO
TRIDIMENSIONAL
punto (6, 3 . -4) y es per-
A continuación se mostrará cómo obtenerecuacionesderectasen
el espacio
tridimensional. SuFoner que 1 es
la
recta en el espacio
tridimensional
que
pasa por el punto Po(xo,y,, z), y es paralela al vector diferente de cero v = (u,
b, c). Es evidente
(figura 4) que 1 consta
precisamente
de
los puntos P(x, y. z)
para los que el vector r P es paralelo a v; es decir, para los que existe un
escalar t tal que
194 / Vectores en 10s espacios bidimensional y tridimensional
En términos de componentes, (6) se puede escribir como
(X - ~ 0y , -yo,
de donde se deduce que x - x.
x = x.
= tu, y
+ tu,
z - zo) = (tu, tb,
-yo = tb y z
y = yo + tb,
tc)
- zo = tc, de modo que
z = zo + tc
Figura 4
Cuando el parámetro t varía de Las ecuaciones
x=x0+ta,
CQ
y=yo+tb,
a+
m.
el punto P(x,y, z ) describe la recta 1.
z=z0+tc
(7)
(--<tt+-t)
~~~~~~~~
se denominan ecuaciones paramétricas de I
Ejemplo 4 La recta que pasa por el punto (1, 2, - 3 ) y es paralela al vector v = (4,
5, - 7 ) tiene las ecuaciones paramétricas
x=1
+ 4t,
.v
=
2
+ 5t,
z = -3
-
7t
(--<tt+-t)
A
Ejemplo 5
a) Encontrar las ecuaciones paramétricas de la recta I que pasa por los puntos
P,(2, 4, - 1) y P,(5, o, 7 ) .
b) ¿Dónde corta la recta al plano y ?
3.5 Rectas y planos en el espacio m'dimensional / 195
L
Solución a). Como el vector P , P , = (3, -4, 8) es paralelo a 1y P,(2, 4 , - 1) pertenece a I, entonces la recta 1está definida por
~ = 2 + 3 t , y=4-4t,
Z =
-1 +8t
(-m<<<++)
Solución b). La recta corta al plano xy en el punto en que z = - 1 + Sf = O , es
decir, donde f = 1/8. Sustituyendoeste valor de f en las ecuaciones parametricas de
1 se obtiene que el punto de intersección es
Ejemplo 6 Encontrar las ecuaciones paramétricas de la recta de intersección de
los planos
Solución. La recta de intersección consta detodos
satisfacen las dos ecuaciones del sistema
los puntos (x, y , z ) que
+
3~ 2y - 42 = 6
x-3y-2z=4
Al resolver este sistema se obtiene
X=26+16f
11
11,
6
2
y = -ii--iit,
z=t
Por consiguiente, las ecuaciones paramétricas de 1son
FORMA
VECTORIAL DE
LA ECUACIóN
DE UNA RECTA
La notación vectorial da otra forma útil para escribir las ecuaciones paramétricas
de una recta; con referencia a la figura 3, sean r = (x, y, z) el vector que va del
origen al punto P(x, y , z), ro = (xo, yo,zo) el vector que va del origen al p u s
Po(xo,yo, zo), y v = (a, 6, c) un vector paralelo a la recta (figura 5). Entonces Pop
= r - ro, de modo que la fórmula (6) se puede volver aescribir como
r-ro=tv
Tomando en cuenta el intervalo de variación de los valores I, la fórmula anterior
se puede escribir de nuevo como
r=r,+tv
(-m<t<+w)
Esta expresión se denominaforma vectoriaf de f a ecuación de una recta en el espacio tridimensional.
136 / Vectores en los espacios bidimensional y tridimensional
Figura 5
.,/
Ejemplo 7 La ecuación
(.\-,?:.)=(-2,0,3)+t(4,
- 7 , 1)
(--<t<+-t)
es la ecuación vectorial de la recta que pasa por el punto (-2, O, 3) y es paralela al
vector v = (4. -7. 1). A
ALGUNOS
PROBLEMAS
DONDE
INTERVIENE LA
DISTANCIA
Esta sección termina con el estudio de dos "problemas de distancia" bhsicos en el
espacio tridimensional:
Problemas
a) Encontrar la distancia entre un punto y un plano.
b) Encontrar la distancia entre dos planos paralelos.
Ambos problemas están relacionados. Si se puede encontrar la distancia entre un
punto y un plano, entonces es posible encontrar la distancia entre planos paralelos
al calcular la distancia entre uno de los planos y un punto arbitrario Po en el otro
plano (figura 6).
Figura 6
1
La distancia entre los planos paralelos V y Cy es
igual a la distancia entre P, v W.
3.5 Rectas y planos en el espacio tridimensional / I Y7
ID=
+
laxO byo + czo + dl
ViGK2
e(.,,
Demostración. Sea
y,, zl) cualquier punto en el plano. El vector normal n
= (a, b, c) se coloca de modo que su punto inicial esté en Q. Como se ilustra en la
figura 7 , la distancia D es igual a la longitud de la proyección ortogonal de
sobre n. Así, por (10) de la sección 3 . 3 ,
Qx
Pero
Así,
D = 14x0 - x, 1 + @Yo - Y ,
d
1 + &o
m
e@,,
- z1
)I
(10)
Como el punto
yl, z i ) pertenece al plano, sus coordenadas satisfacen la
ecuación del plano; entonces
ax, + by, + cz, + d = O
O
d=
-
ax, - by, - czl
Sustituyendo esta expresión en (IO) se obtiene (9).
0
198
I Vectores en los espacios hidimensional y tridimensional
OBSEHVACI~N. Nótese la semejanza entre (9) y la fórmula de la distancia entre
un punto y una recta en el espacio bidimensional(13) de lasección 3.3.
Ejemplo 8 Encontrar la distancia D entre el punto (1, -4, -3) y el plano 2x - 3y
+ 6 z = -1.
Solución. Para aplicar (9), primero se vuelve a escribir la ecuación del plano en
la forma
2~ - 3 ~ + 6 1~= +
O
Entonces
D=
/(2)(1)+(-3)(-4)+6(-3)+1)
q 2 2 + (-3>*+ 62
--=1-31
-
7
3 A
7
Dados dos planos, si se cortan, entonces se pregunta por su recta de
intersección (como en el ejemplo 61, o si son paralelos, entonces se pregunta por la
hstancia entre ellos. El siguiente ejemplo ilustra el segundo problema.
Ejemplo 9 Los planos
x+2y-22=3
y 2x+4y-4z=7
son paralelos, ya que sus normales (1, 2, -2) y (2, 4, -4) son vectores paralelos.
Encontrar la distancia entre estos planos.
Solución. Para encontrar la distancia D entre los planos, se puede elegir un
punto arbitrario en uno delos planos y calcular su distancia al otro plano.
Haciendo y = z = O en la ecuación x + 2y - 22 = 3 , se obtiene el punto P,(3, O, O)
en este plano. Por (9), la distancia entre Po y el plano 2x + 4y - 42 = 7 es
_ _ ~ ~ ~
~
EJERCICIOS DE LA SECCIÓN 3 5
1. Encontrar una forma punto-normal de la ecuación del plano que pasa por P y cuya
normal es n.
-2); n = ( - 2 , 1, -1)
c ) P(2, O, O); n = (O, O, 2)
a) P ( - l , 3 ,
b)P(l, 1,4); n = ( l , 9 , 8 )
d ) P(0, O, O); n = (1, 2, 3)
2. Escribir en forma generallas ecuaciones de los planos del ejercicio l .
3.5 Rectas y planos en el espacio tridimensional / 199
3. Encontrar una forma punto-normal
a) - 3 x + 7 y + 2 z = 10
b) ~ - 4 ~ = 0
4. Encontrar la ecuación del planoque pasa por 10s puntos dados
a) P(-4,
-
1, - I ) ,
Q(-2, O, I), R ( - 1, -2,-3)
b) P(5,4, 31, Q(4, 3, I ) , R(1, 5,4)
5. Determinar si los planos son paralelos
y 7~-3y+42=8
a) 4 x - y + 2 z = 5
b)x-4y-3~-2=0
y 3 ~ -1 2 ~ - 9 ~ - 7 = 0
c) 2 y = 8 x - 4 z + 5
y x = + z + ' 4Y
6. Determinar si la recta y el plano son paralelos.
a ) x = -5-4t,
y = l -t, z = 3 + 2 t ; x + 2 y + 3 z - 9 = 0
b)x=3t, y = 1+ 2 t , z = 2 - t ; 4 x - y + 2 ~ = 1
7. Determinar si los planos son perpendiculares.
a) 3 x - y + z - 4 = 0 ,x + 2 z =
-1
b) x - 2 y + 3 z = 4 ,- 2 x + 5 y + 4 z =
-1
8. Determinar si la recta y el plano son perpendiculares
a) x = - 2 - 4 t , y = 3 - 2 r , z = 1 + 2 t ; 2 x + y - z = 5
b)x=2+t, y = l -t, ~ = 5 + 3 t ; 6 ~ + 6 ~ - 7 = 0
9. Encontrar las ecuaciones paramétncas de la recta que pasa por P y es paralela a n.
a) P(3, - 1, 2), n = (2, 1, 3)
c) P(2, 2, 6); n = (O, 1, O)
b) P(-2, 3, -3); n = (6, -6, -2)
d) P(0, O, O); n = (1, - 2, 3)
10. Encontrar las ecuaciones paramétricas de la recta que pasa por los puntos dados
a> (5, -2, 4), (7, 2, - 4)
b) (O, O, O>, (2, - 1, - 3)
11. Encontrar las ecuaciones paramétricas de la recta de intersección de los planos dados
a) 7 x - 2 ~ + 3 ~ -2
=
y
-3x+y+2z+5=0
b) 2 x + 3 y - 5 ~ = 0 y
12. Encontrar la forma vectorial de la ecuación del plano que pasa por Po y cuya nor-
mal es n.
a) P 0 ( - l , 2 , 4 ) n; = ( - 2 , 4 ,
1)
c) P0(5,-2, 1); n = ( - I , O,O)
b) P0(2,0,
-5);
n=(-l,4,3)
d) Po(O,O, O); n = (u, b, c )
13. Determinar si los planos son paralelos
a) ( - l , 2 , 4 ) . ( ~ - 5 , ~ + 3 , ~ - 7 ) = 0 ; (2, -4, - 8 ) - ( ~ + 3 , ~ + 5 , ~ - 9 ) = 0
b)(3,0,-I).(x+I,y-2,~-3)=0;
(-I,O,~).(X+I,~-Z,Z-~)=O
14. Determinar si los planos son perpendiculares.
l , y , z + 3 ) = 0 ; ( I , -2, I ) . ( x + ~ , ~ - ~ , z ) = o
b ) ( 3 , 0 , - 2 ) . ( ~ + 4 , ~ - 7 , ~1 )+= O ; (1, I , I ) . ( x , y , z ) = O
a) ( - 2 , l , 4 ) . ( x -
15. Encontrar l a forma vectorial de la ecuación de la recta que pasa por p , y es pa-
ralela a v.
a) P o ( - l > 2 , 3 ) ; v = ( 7 , - 1 , 5 )
C) Po(L -4, 1); v = (O, O, - 2)
b) Po(2,0, - I ) ; VE(], I , I )
d) Po(O, O, O); v = ( U , b, C)
y=O
200 / Vertnres en los espacios bidimensionai y tridimensionul
16. 1)t:mostrar. que la recta
,x- = o,
y = [ *
z-
(-E.<!<
+,A)
a ) pertenece al plano hx + 4y - 42 = (J.
11) es paralelaal plano 5x - 3y + 3z = 1 y csth por abajo de éste.
L) es paralela ai plano 6x + 2y - 22 = 1 y esti por arriba de éste
18. Encontrar la ecuación del
a) plano KV.
b) piano xz.
c)
plar~ovz.
19. Encontral. la ecuación del piano que contiene al punto (xo,yo. zo) y es paralelo al
a) plano x y .
b)
plano yz.
c) plano xz.
20. t-hcontrar l a ecuacrón del plano que pasa por el origen y es paralelo al plano 7x +
4y - 2 2 + 3 - 0 .
21. Encontrar la ecuación del plano que pasa por el punto (3, -6, 7) y es paralelo al plano
5, - 2 y + z - S=().
22. Jhcontrar el punto de intersección de l a recta
x-9=-sr,
y+l--t,
z-3=r
(--cc<t<+m)
y el plano 2x -. 3v + 42 + 7 = O.
23. Encontrar l a ecuación del plano que contiene a la recta x =
-= 2 - t y es perpendicular al plano 2x - 4y + 22 = 9.
- I + 3t, y
=5
+ 2t, z
21. Ilncontrar la ecuación delplano que pasa por (2, 4, - 1) y contiene a la rectade
intersección de los planos x y - 4z = 2 y - 2 x + y + 22 = 3 .
-
25. Demostrar que los puntos (-1,
pertenecen al mismo plano.
-2,
-3), ( - 2 , O, I), (-4,-1,
-1)
y (2, O, 1)
26. Encontrar las ecuaciones paramétncas de l a recta que pasa por ( - 2 , 5 , O) y es paralela
alosplanos2x+y-4z=Oy -x+2y+3z+1 =O.
27. Encontmr l a ecuación del plano que pasa por ( - 2 , I , S ) y es perpendicular a los planos
4~ - 2 ~ + 2 ~- 1 =V 3 ~ + 3 y- 6 . ~ ~ 5 .
28. Encontrar la ecuación del plano que pasa por (2, - 1,4) y es perpendicular a la recta de
intersección de los planos 4x + 2y + 2z =-1 y 3x + 6y + 32 = 7.
29. Encontrar la ecuación del plano que es perpendicular al plano 8x - 2y + hz = 1 y pasa
por los puntos P I ( - i , 2 , S) y P2[2, I , 4).
30. Demostrar que las rectas
3.5 Rectas y planos en el espacio tridimensional / 201
x=3-2t,
y=4+r,
z=l-t
(--<<<++)
x=5+2t,
y=l-t,
z=7+r
(--<tt++)
Y
son paralelas y encontrar la ecuación del planoque determinan.
31. Encontrar la ecuación del plano que contiene al punto (1,
+ l , ~ -3
= +2t.
- 1,2) y a la recta x = t, y
=t
32. Encontrar la ecuación del plano que contiene a la recta x = 1 + t , y = 3t, z = 2t y es
paralelo a la recta de intersección de los planos -x + 2y + z = O y x + z + I= O.
33. Encontrar la ecuación del plano tal que todos sus puntos equidistan de (- 1, -4, -2) y
(0, -2,2).
34. Demostrar que la recta
x-5=-t,
y + 3 = z2 +t ,1 = (- -5-tp < t < + ” O )
esparalelaalplano - 3 x + y + z
- 9=0.
35. Demostrar que las rectas
x - 3 = 4yt-,4 =zt-,l = O
(-rn<t<+m)
Y
~ + 1 = 1 2yt -, 7 = 6~t ,- 5 = 3 t
(-x<t<+x)
se cortan y encontrar el punto de intersección
36. Hallar la ecuación del plano que contiene a las rectas del ejercicio 35.
37. Encontrar las ecuaciones paramétricas de la recta de intersección de los planos
a) -3x+2,v+z=
-5
and 7 x + 3 y - 2 z = - 2
b) 5 1 - 7y 2z = O and y = O
+
38. Demostrar que elplano cuyascoordenadas al origen son x = a,y = b, z = c tiene la ecuación
x y z
-+-+-= 1
a b c
en el supuesto de que a, b y c son diferentes de cero,
39. Encontrar la distancia entre el punto y el plano,
a) (3, 1, -2); x + 2y - 2z = 4
b)(-1,2,
I ) ; 2 ~ + 3 ~ - 4 z =1
C) (0,3, -2); x - Y - z = ~
40. Encontrar la distancia entre los planos paralelos dados
a) 3x - 4y + z = 1
b) - 4 ~ + y - 3 ; = 0
c) 2 x - . v + z =
1
y
y
+
22 = 3
8~-2,v+6z=O
2x-y+z=
-1
61 - S,V
y
41. Demostrar que si las constantes a, b y c no son cero, entonces la recta
202 / Vectores en los espacios bidimensional y tridimensional
y=y,+bt,
x=x,+at,
(--<<<+-m)
z=z,+ct
consta de todos los puntos (x,y, z ) que satisfacen
x--,
-Y
a
-Yo-2-%
h
c
Estas expresiones se denominanecuaciones sim&ricas de la recta
42. Encontrar las ecuaciones simétricas de las rectas de los incisos a) y b) del ejercicio 9.
[Nota Ver el ejercicio 4 1 respecto a la terminología.]
43. En cada inciso, encontrar las ecuaciones de los dos planos cuya intersección es la recta
dada.
a)x=7-4t,
b)x=4t,
y = -5-2t,
,v=2t,
z=7t
z=5+f
(-m<t<
(-m<[<
+m)
+m)
[Sugerencia. Cada igualdad en las ecuaciones simétricas de una recta representa un
plano que contiene a la recta. Ver el ejercicio 4 1 respecto a la terminología.]
44. Dos planos que se cortanen el espaciotridimensionaldeterminandosángulosde
intersección: un ángulo agudo (O 5 8 5 90°) y su suplemento 1 SOo - 8 (figura Sa). Si
n1 y n2 son normales diferentes de cero a los planos, entonces el ángulo entre nl y nz
es 8 o 180° - 8 , dependiendo dea
ls direcciones de las normales (figura 8b). En cada
inciso, determinar el ángulo agudo de intersección de los planos, hasta el grado más
próximo.
y
2x-y+z-4=0
b)x+2y-22=5
y
6~-3.~+2~=8
a)x=O
[Nota Se requiere calculadora.]
Figura 8
45. Encontrar el ángulo agudo de intersección entre el plano x - y - 32 = 5 y la recta x =
2 - t, y = 2t, z = 3t - 1 hasta el grado más próximo. [Sugerencia Ver el ejercicio 44.1
4.1
ESPACIOEUCLIDIAN0 n DIMENSIONAL
La idea de usar parejas
de números para localizar puntos en el plano
y
ternas de números para localizar puntos en el espacio tridimensional
fue
explicada con claridad por vez primera a mediados del siglo XVII. Al jinal
del siglo XIX los matemáticos y losfisicos comenzaron a darse cuenta de que
no era necesario detenerse en las ternas. Se reconoció que las cuádruplas de números (al, a2, a3, a4) podían
considerarse como puntos en el espacio de "tetradimensional", las quíntuplas ( a l , a2, . . . , a5) como puntos en el espacio
de "pentadimensional", y así sucesivamente. A pesar de que nuestra representación geométrica se limita al espacio tridimensional, muchos conceptos
conocidos se pueden extender más allá del espacio tridimensional trabajando con las propiedades analíticaso numéricas de puntosy vectores en vez de
hacerlo con las propiedades geométricas. En esta sección se precisarán con
más detalle esas ideas.
VECTORES EN EL
ESPACIO n
DIMENSIONAL
Definición. Si n es unentero positivo, entonces una n-ada ordenada es una
sucesión de n números reales (al, a2,. . . , an). El conjunto de todas las n-adas
ordenadas se denomina espacion dimensional y se denota por R".
203
204 i Espacios vectoriales euclidianos
Cuando n = 2 o 3, se suelen usar los términos pareja ordenada o terna ordenada,
respectivamente, en vez de 2-ada o 3-ada ordenadas. Cuando n = 1, cada n-ada
ordenada consta de un número real, de modo que R' se puede considerar como el
conjunto de los números reales. Para denotar este conjunto se escribe R en vez de
R'.
Quizá el lector observó al estudiar el espacio tridimensional, que el símbolo
(al, a2, a3) tiene dos interpretaciones geométricas: se puede interpretar como un
punto, en cuyocaso a l , a2 y a3 son las coordenadas figura la), o puede
interpretarse como un vector, en cuyo caso a l , a2 y a3 son las componentes (figura
lb). Se deduce así que una n-ada ordenada (al, a2, . . . , a,) se puede considerar
como un "punto generalizado" o como un ''vector generalizado": matemáticamente, la diferencia carece de importancia. Así, la 5-ada (-2, 4, O , 1, 6) se puede
describir como un punto en R5 o como un vectoren R S .
Figura
I
[La tema ordenada (al, a2, d 3 ) se puede interpretar geométricamente como un punto o un
I vector.
I
Definición. Dos vectores u = (u1, u2, . . . , u,) y v = (vl, v2, . . . , v,) en R" se
denominan iguales si
u1
= u , , u2 = V I , .
..
f
u, = u ,
La suma u + v se define por
u +v
= (u,
+ u,, u2 + u2, . . . , u, +u,)
y si k es cualquier escalar, entonces el múltiplo escalar ku se define por
1-
4.1 Espacio euclidiano n dimensional / 205
Las operaciones de adición y multiplicación escalar en esta definición se denominan operaciones normales sobre R".
El vector cero en R" se denota por O y se define como el vector
o = (O,
O, . . . , O)
Si u = (ul, u2, . . . , un) es cualquier vector en R", entonces el negativo o (inverso
aditivo) de u se denota por -u y se define por
-u =(-u,,
-u2,.
. . , -un)
La diferencia de vectores en R" se define por
v-u=v+(-u)
o, en términos de las componentes,
v - u = (u, - u,, u2 - 2.42, . . . , U"
PROPIEDADES
DE LAS
OPERACIONES
VECTORIALES
EN EL
DIMENSIONAL
-
u,)
En el siguiente teorema se enumeran las propiedades aritméticas más importantes
de la adición y la multiplicación escalar devectores en R". Todas las demostraciones son fáciles, por lo que se dejan comoejercicios.
Teorema 4.1.1. Si u = (u1,u2, . . . , un),v = (vl, v2, . . . vfl)y
w = (wl, w2,. . . w n >son vectores en R" y k y 1 son escalares, entonces:
~
I
a) u + v = v + u
6) u + ( v + w ) = ( u + v ) + w
c) u + o = o + u = u
d ) u+(-u)=O;esdecir, u-u=O
e ) k(1u) = (kl)u
f)k(u+v)=ku+kv
g ) ( k + /)u = ku lu
h) l u = u
+
I
Este teorema permite operar vectores R" sin necesidad de expresarlos en
términos de las componentes. Por ejemplo, para despejar x en la ecuación vectorial
x + u = v, se puede sumar -u a ambos miembros y proceder como sigue:
(X+U)+(")
=v+(-u)
x+(u-u) =v-u
x+o =v-u
x =v-u
206 i Espacios vectoriales euclidianos
Es instructivo que el lector mencione los incisos del teorema 4.1.1 que justifcan
los tres últimos pasos de este cdculo.
ESPACIO
EUCLIDIAN0 n
DIMENSIONAL
Para extender losconceptos de distancia, norma y ángulo a R", se empieza con la
siguiente generalización del producto punto sobre R2 y R3. Fórmula (3) de la sección 3.31.
Definición. Si u = (ul, u2, . . . , un), y v = ( v l , v 2 , . . . vn) sonvectores
cualesquiera en R", entonces el producto interior euclidiano u v se define por
u.v
= UIU,
Observar que cuando n
producto punto ordinario.
=
+ u*u* + . . . + unvn
2 on
=
3, el producto interior euclidiano es el
Ejemplo 1 El producto interior euclidiano de los vectores
u = (-1, 3, 5, 7 )
y
v = (5, -4, 7, O )
en R4 es
~.~=(-1)(5)+(3)(-4)+(5)(7)+(7)(0)=18 A
Como muchos de los conceptos conocidos de los espacios bidimensional y
trilmensional existen en el espacio n dimensional, es común referirse a R", con
las operaciones de adición, multiplicación escalar y producto interior euclidiano
que se han definido aquí, como espacio euclidiano n dimensional.
En el siguiente teorema se enumeran las cuatro propiedades aritméticas más
importantes del producto interior euclidiano.
Teorema 4.1.2. Si u, v y w son vectores en R" y k es cualquier escalar,
entonces:
a)
u.v=v.u
b) ( u + v ) . w = u . w i - v . w
c ) (ku). v = k(u v )
d ) v.v?O.Además,v-v=Osiysólosi
.
-
v=O.
Se demostrarán los incisos b ) y d), y las demás demostraciones se dejan
como ejercicios.
4.1 Espacio euclidiano n dimensional / 207
Entonces
( u + v ) . w = ( u , +u,,u,+u,,
. . . , U,+U,).(Wl,W2,
. . . , w,)
+ U l ) W l + (u2 + u2)w2 -t.. + (u, + u,)w,
= (ulw, + u*w2 + . + u,w,) + ( U 1 W , + u2w2 + . . + u,w,)
=u.w +v.w
= (UI
'
' '
Demostración de
d).
Se tiene vv
=
'
v++v#+ ...+v
O. Además, la igualdad se
cumple si y sólo si v1 = v2 = . . . = v,, = O, es decir, si y sólo si v = O .
0
Ejemplo 2 EL teorema 4.1.2 permite realizar cálculos con productos interiores
euclidianos de manera bastante semejante a como se efectúan con productos aritméticos ordinarios. Por ejemplo,
+ v) + (2v) - (4u + v)
= (3u) (4u) + (3u) v + (2v) (4u) + (2v)
= ~ ~ ( I I -+u~) ( u - v+
) ~ ( v - u+) ~ ( v - v )
(3u + 2v) * (4u + v) = (3u) (4u
=
*v
12(u.u)+ lI(u.v)+2(v.v)
El lector debe determinar qué incisos del teorema4.1.2 se aplicaron encada paso. A
NORMA Y
DISTANCIA EN
EL ESPACIO
EUCLIDIAN0 n
DIMENSIONAL
Por analogía con las conocidas fórmulas en R2 y R3, la norma euclidiana (o
longitud euclidiana) de un vector u = (u1, u2, , . . , U,,) en R" se define por
11u11 = (u *
=v u :
+ 2.4'2 + . . . + ut
[Comparar esta fórmula con las fórmulas (1) y (2) de la sección 3.2.1
De manera semejante, la distancia euclidiana entre los puntos u
. . , U,,) y v = (y1, v2, . . . , vn) en R" se define por
(1)
=
(ul, uz, .
Ver las fórmulas (3) y (4) de la sección 3.2.
Ejemplo 3 Si u = (1, 3, -2, 7) y v = (O, 7, 2, 2), entonces en el espacio euclidiano
R" se tiene que
Y
d(u,v)=2/(1-0)2+(3-7)2+(-2-2)2+(7-2)2=fi
. ...
I
..".".
A
208
,'
Espacios vectoriales euclidianos
El siguiente teorcrna proporciona una de las desigualdades más importantes
del Algebra lineal, la desigualdad de Cauchy-Schwarz*
Teorema 4.1.3. (Desigualdad deCauchy-Schwarz en R"). Si
son vectores en R", entonces
I
o, expresada en términos de las componentes,
*ilugustin Louis Barón de) Cauchy (1789-1857). Matemático francés. Cauchy recibió su primera
educación de su padre,abogado y que también era maestro
de los clásicos. Cauchy ingresó a l a
Ecole Polytechniqueen
1805 paraestudiaringeniería,perodebidoa
su quebrantadasalud, le
recomendaronconcentrarscen
las matemáticas. Su trabajomatemáticoespecializadoempezó
en
181 1 con una serie de brillantes soluciones de algunos prohlemas sobresalientes dificiles.
[ a s contribuciones
matemáticasdeCauchydurantc
los 35 afioius siguientesfueronbrillantes
y
asombrosas en cantidad, > a que produjo más de 700 articulos que abarcan 26 volúmenes modernos. El
trabajo de Cauchy inició la era del análisis moderno, aport6 a In%matemáticas n o m a s de precisión y rigor
jamás soñados por matemáticos anterioresa 61.
I,a vidadeC;ruchyestuvoligadademanerainextricable
a los aconteclmientos políticos de l a
&poca.Fuerte partidario de los Worbones, abandonó a su mujer e hijo en I 830 para seguir a l exllio ai
rey borbón Carlos X. Debido a su lealtad, el ex-rey lo nombr6 barón. Cauch? volvió finalmentc a
Francia pero rehuso aceptar u n puesto universltario. hasta que el gobierno ccdio al requisitc dr: que
prestara juramento.
Es dificil tener una imagen clara de la personalidad de Cauchy. Devoto católico, patrocinó obra>
Sin embargo.otroz
dccarldad para madressolteras y criminales, asi como deayudaaIrlanda
aspectos de su vida lo presentan de manera desfavorable. E 1 matcmitico noruego Abel lo describe
co1710"loco. i~~finitamrnte caiólicny fanático". Algunos escritorespregonan sus enseñanzas.pero
otros aiirman q u e divagaba incoherenc~asy. según un informe de l a época. una ocasión dedic6 toda
una clase a extraer l a raíz cuadrada de 17 a 10 cifras decimales aplicando un metodo bien conocido
por SUS estudiantes. En todo caso, Cauchy cs indiscutiblemente una de las grandes luminarias en la
historia de l a ciencia.
f f e r m a n .4mandrrs Schwarz 1843.1921). Matemático alemán. Schwarz fue e1 matemático más
Importanteenncrlíndurantelaprimeraparte
del siglo NX. Debidoa la devoción que guardaba
respecto a s u s deberes académicos ell la IJniversidad de Berlín y a una propensión a tratar con la
misma dedicaciónhechosimportantes
y hechostriviales, n o public6 en grani,olumen.Tendía a
centrarse en estrechosproblemasconcretos.pero
sus técnicaseran
a nrenudoextremadarnents
brillantes e influenciaban el trabajo de otros matemiticos. l J n a versión de l a desigualdad que llc\a
su nonlbre apareció en un artículo sobre superficies de área minima publicado en 1885
4.1 Espacio euclidiano n dimensional / 209
Por el momento se omite la demostración, ya que después en el texto se demostrará
una versión más general de este teorema. Sin embargo, para vectores en R2 y R3,
este resultado es una simple consecuencia de la fórmula (1) de la sección 3 . 3 : Si u
y v son vectores diferentes de cero en R2 o R3, entonces
lu.vl
=
I11~11llvll cos 81 = llull llvll /cos el 5 llull llvll
(5)
y si u = O o v = O , entonces ambos miembros de (3) son cero, de modo que también
en este caso se cumple la desigualdad.
En los dos teoremas siguientes se enumeran las propiedades básicas de la
longitud y la distancia en el espacio euclidiano n dimensional.
~~
~~
rTeorema 4.1.4. Si u y v son vectores en K" y k es cun!quier escalar, entonces:
Se demostrarán los incisos c ) y
ejercicios.
d),
I
y las demostraciones de a) y 6) se dejan como
Demostración de c). Si u = (u1, u2, . . . , U,), entonces ku = (kul, ku2, . . . , ku,),
modo que
de
Demostración de d).
((u+v((2=(u+v).(u+v)=(u.u)+2(u.v)+(v.v)
+
= ()u/12 2(u v)
5 11u112
S
=
+ (/VI12
+ 21u * V I + IIVII?
I(u((~+ 2llull ((v((+ ( ( ~ ( 1 ~
Propiedad del valor absoluto
Desigualdad de Cauchy-Schwarr.
I
tllull + //v11~2
El resultado se deduce ahora extrayendo raíz cuadrada a ambos miembros,
0
El inciso c) de este teorema establece que al multiplicar un vector por un
escalar k, la longitud del vector se. multiplica por un factor k (figura 2a). El inciso
d) de este teorema se conoce comodesigualdad del triángulo, ya que generaliza el
conocido resultado de la geometría euclidiana el cual establece que la suma de las
210
2,'
I+pacio,s vectariales euclidianos
longitudes de dos lados de un triángulo es mayor o igual que la longitud del tercer
lado (figura 2b)
Figura 2
Teorema 4.1.5. Si u, v y w son vectores en R" y k es cualquierescalar,
entonces
d(u, v) 2 o
6) d(u, v) = o S I .v sólo SI u = v
c) d(u, v) = d(v, u)
d ) d(u, v) 5 d(u, w ) + d(w, v) (Desigualdad del trriúngulo)
(Z)
Los resultados de este teorema son consecuencias inmediatas del teorema 4.1.4 Se
demostrará el inciso d) y las demostraciones de los demás incisos se dejan como
ejercicios.
Demostración de d). Por (2) y el inciso d)del teorema 4.1.4, se tiene
d(u, v) = \/u- VI/ = Il(u w) + (w - v)l/
5 ljll - w// l/w - VI/ = d(u, w) + d(w, v)
"
+
o
El inciso d) deeste teorema, que también se denomina desigualdad del
triúngulo, generaliza el conocido resultado de geometría euclidiana que establece
que la distancia más corta entre dos puntos es una recta (figura 3 ) .
4.1 Espacio euclidiano n dimensional / 21 1
La fórmula (1) expresa la norma de un
ducto punto. El siguiente teorema útil expresa
de normas.
vector en términos de un proel producto punto en términos
Teorema 4.1.6. Si u y v son vectores en R" con producto interior euclidiano,
entonces
u .v
+
= +/\u VI12
(6)
- +ilu - VI12
I
1
Demostración.
a partir de lo cual (6) se concluye por álgebra simple.
0
En los ejercicios se proporcionan algunos problemas numéricos en los que se
aplica este teorema.
ORTOGONALIDAD
Recordar que en los espacios euclidianos R2 y R3 dosvectores u y v se definen
como ortogonales perpendculares) si u v = O (sección 3.3). Con esta motivación
se presenta la siguiente definición.
Definición. Dos vectores u y v en R" se denominan ortogonales si u v = O .
Ejemplo 4 En el espacio euclidiano R4,los vectores
u = (-2, 3, 1, 4) y v = (1, 2, o, -1)
son ortogonales, ya que
~.~=(-2)(1)+(3)(2)+(1)(0)+(4)(-1)=0
A
Después, en el texto, se analizarán con más detalle las propiedades de los
vectores ortogonales, aunque en este momento se observa que muchas de las
propiedades conocidas de los vectores ortogonales en los espacios euclidianos R2 y
R3 son verdaderas en el espacio euclidiano R". Por ejemplo, si u y v son vectores
ortogonales en R2 o en R3, entonces u, v y u + v forman los lados de un triángulo
rectángulo (figura 4); así, por el teorema de Pitágoras,
21 2 I Espacios vectoriaIes euclidianos
Figura 4
U
El siguiente teorema muestra que este resultado se extiende a R".
Teorema 4.1.7. (Teorema de Pitágoraspara R"). Si u y v son vectores ortogonales en R" con el producto interior euclidiano, entonces
1111 + V I 2 = 11U1l2 + llvll2
OTROS TIPOS DE
NOTACIÓN PARA
VECTORES EN R"
[;I
Un vector u = u l , u2, . . . , U,,) en R" también sepuede escribir en notación
matricial como matriz renglón o matriz columna:
U=
o
u=[.,
u2
...
u,]
u,
Lo anterior se justifica porque con lasoperaciones matriciales
se obtienen los mismos resultados que con las operaciones vectoriales
u + v = ( U l , u 2 , . . . , u,) + (u,, u 2 , . . . , u,) = (u1 + u,,
ku = k ( u , , u2,. . . , u,) = ( k u , , ku,, . . . , ku,)
u2
+ u,,.
. . , un
+ u,)
4.1 Espacio euclidiano n dimensional / 213
La única diferencia es la forma en quese escriben los vectores.
UNA FORMULA
MATRICIAL
PARA EL
PRODUCTO
PUNTO
Si los vectores se escriben como matrices columna
U =
y en las matrices 1X 1 se omiten los corchetes, entonces se deduce que
Así, para vectores expresados como matrices columna se tiene la siguiente fórmula
para el producto interior euclidiano:
-;I
E3
VTU =
Por ejemplo, si
u=[
u.v
entonces
u.v=vTu=[5
Si A es una matriz n X n, entonces por la fórmula (7) y las propiedades de la
transpuesta se concluye que
AU v = ~'(Au)= (v'A)u = (A'v)=u = U * A'v
u .Av = (Av)Tu = (v=AT)u= vT(ATu) = ATU. v
214 / Espacios vectoriales euclidianos
constituyen un vínculo importante entre la multiplicación por una matriz A n
y la multiplicación por AT.
Ejemplo 5 Suponer que
A = [
1
2
31],
-2
-1
4
o
.=[-;I, -p1
X
n
v=[
1
Entonces
1
-: ;][ ;] [
.
.
-
o
4
I
=
-:I[ -;I= [-;
1
1
-
1.
a partir de lo cual se obtiene
AU v
=
7( - 2) + lO(0) + 5(5)
=
I1
u*ATv=(-1)(--7)+2(4)+4(-1)=
11
Así, Au * v = u A%, como garantiza la fórmula (8). Se deja para el lector la
comprobación de que (9) también se cumple. A
UN PRODUCTO
PUNTO
CONSIDERADO
COMO
MULTIPLICACIÓN
MATRICIAL
Los productospuntoproporcionanotraformadeentender
dematrices.Recordarquesi
A = [a,] esunamatriz
m
matriz Y X n , entonces el ij-ésimo elementode A B es
que es el producto punto del i-ésimo vector renglón de A
y el j-ésimo vector columna de B
X
la multiplicación
r y B = [b,.] esuna
4.1 Espacio euciidiano n dimensional
/
215
Por tanto, si los vectores renglón de A son r,, r,, . . . , r, y los vectores columna
de B son c l , c,, . . . , c,, entonces el producto matricial A B se puede expresar como
AB =
En particular, un sistema lineal Ax
punto como
=
b se puede expresar en forma de producto
rl.x
r2- x
-
rm x
donde rl, r l , . . . , rm sonlosvectoresrenglónde
elementos de b.
A y b,, b,, . . . , bm sonlos
Ejemplo 6 A continuación se presenta un ejemplo de un sistema lineal expresado
en la forma de producto punto (1 1).
Sistema
Forma de producto punto
EJERCICIOS DE LA SECCIÓN 4.1
1. S e a n u = ( - 3 , 2 , l , O ) , v = ( 4 , 7 , - 3 , 2 ) y w = ( 5 ,
a) v - w
d) 6(u - 3v)
b) 2~ + 7~
e) - v - w
-2, 8, 1). Encontrar
"U + (V - 4 ~ )
f ) (6v - w ) - (4u v)
C)
+
2. Sean u, v Y w 10s vectores del ejercicio 1. Hallar el vector x que satisface 5x
(2w - 5%).
- 2v =
4. Demostrar que no existen escalares cl , c2,c3 y c4 tales que
c,(l, o, 1, 0) + c2(1,
o,
-2, 1) + c3(2, o, I , 2) = ( I , -2, 2, 3 )
5. En cada inciso, calcular la norma euclidiana del vector.
a) (-2, 5)
b) (1,2, -2)
c ) (3,4, O, -12)
d) (-2, II, ,
-3,4)
218
1'
Espacios vectoriales euclidianoh
VI
= ( U l , o, o, . . . , O),
v2
=
(O,
(I?,
o, . . . , O), . . , v,
,
= (O,
o, o, . . . , a,,)?
b) ¿,Cómo definiría el lector la longitud euclidiana de la "diagond" de l a caja en el
inciso a)?
4
Figura 5
4.2 TRANSFORMACIONES LINEALES DE P A
Ry"
En esta sección se iniciara el estudio de funciones de la forma w = F(x), donde la
variable independiente H es un vector en Rn y la variable dependiente w es un vector
en N"'.La atención se centrará en una clase especial de tales funciones denominadas
"transfonnaciones lineales". Las transformaciones lineales son fundamentales en el
estudio del álgebra lineal y tienen muchas aplicaciones importantes en faica,
ingeniería, ciencias socialesy diversas ramas de la matemática.
FUNCIONES DE
F A R
Recordar que una funcidn es una regla f que asocia a cada elemento de un
conjunto A uno y sólo un elemento de un conjunto B. Sifasociael elemento b con
el elemento a, entonces se escribe b = A a ) y se dice que b es la imagen de a bajof,
o que f ( a ) es el valor de f e n a. El conjunto A se denomina dominio d e f y el
conjunto B se denomina codominio del: El subconjunto de B que consta de todos
los valores posibles def cuando a varía sobre A se denomina recorrido de f: Para
las funciones más comunes, A y B son conjuntos de números reales, en cuyo casof
se denominafunción con valores reales de una variable real. Otras funciones COmunes Ocurren cuando B es un conjunto de números reales y A es un conjunto de
vectores en R2, R3 o, más generalmente, en R". En la tabla 1 se muestran algunos
ejemplos.
4.2 Transformaciones lineales de R" a Rm / 219
TABLA 1
Fórmula
I Ejemplo
Descripción
Clasificación
~~~
f (x>
f (x)
=x2
Función de valores reales Función de R a R
de una variable red
' Función de valores reales
Función de R2 a R
de dosvariables reales
Función de valores reales Función de R3 a R
de tres variables reales
Función de valores reales Función de R" a R
de n variables reales
Dos funcionesfi y f2se consideran iguales, escrito como f l
mismo dominio y f i ( a ) =&(a) para toda a en el dominio.
FUNCIONES DE
R" A R m
=&, si tienen el
Si el dominio de una funciónfes R" y el codominio es Rm(m y n quizá iguales),
entoncesf se denomina transformación de R" a Rm,y se dice que f mapea (aplica
o transforma) R" en Rm. Este hecho se denota escribiendo $ R" -,
Rm. Las funciones que se presentan en la tabla 1 son transformaciones para las que m = 1.
Para el caso especial en que m = n, la transformación$ R" + R" se denomina operador sobre R". El primer elemento en la columna 2 de la tabla 1 es un operador
sobre R.
Para ilustrar una forma importante en que pueden surgir las transformaciones, suponer quefl,fi, . . . ,fm son funciones con valores reales de n variables reales, por ejemplo
Estas m ecuaciones asignan un punto Único (wl, w2,. . . , w,) en Rm a cada punto
(x1,x2, . . . , X,,) en R" y, por tanto, definen una transformación de R" a Rm.Si esta
transformación se denota por T, entonces T:R" + Rm y
Ejemplo 1 Las ecuaciones
w1
= x,
w2
=
+ x2
3x,x2
wj = x ; - x;
220 1 Espacios vectoriales euclidianos
definen una transformación T:R2 -+ H3. Con esta transformación, la imagen del
punto (xl, xz) es
= (11 f X2, 3xlX2, 1
: -.X:)
T(X,, X2)
Así, por ejemplo,
-6, - 3 )
T(1, - 2 ) = ( - 1 ,
TRANSFORMACIONES
LINEALES DE
R"aP
A
En el caso especial en que las ecuaciones de (1) son lineales, la trasformación T:Rn
+ K" definida por esas ecuaciones se denomina transformación lineal (u operador lineal si m = n). Así, una transformación lineal T:R" Rm está definida por
ecuaciones de la forma
-+
W]
= a,+]
+ a,2x2 +
' '
. + a,,x,
o bien, en notación matricial,
o, más brevemente,
w =Ax
La matriz A = [ a -1
. se denomina matriz estrindar de la transformación lineal T y T
se denomina muhplicación porA .
Ejemplo 2 La transformación lineal T:R4 + R3 definida por las ecuaciones
WI=
2x1 - 3x2 f
w 2 =
4x,
+
X3
x2 - 2x3
w 3 = 5x, - x* + 4x3
se puede expresar en forma matricial como
de modo que lamatriz estándar para T es
- 5x4
+
,x4
4.2 Transformacioneslineales de R" a Rm / 221
La imagen de un punto (xl, x2, x3, x4) se puede calcular directamente a partir de
las ecuaciones de definición (5) o a partir de (6) por multiplicación de matrices.
Por ejemplo, si (xl, x2, x3, x4) = (1, -3, O, 2), entonces al sustituir en (5) se
obtiene
wI=l,
w2=3,
w,=8
(comprobar) o, alternativamente, a partir de ( 6 )
ALGUNOS
COMENTARIOS
SOBRE LA
NOTACI~N
Si T:R" + Rm es una multiplicación por A , y si es importante recalcar que A es la
matriz estándar para T, entonces la transformación lineal TR" "* Rm se denota
por TA:R"+ Rm.Así,
TA(x)= A x
(7)
En esta ecuación se sobrentiende que el vector x en R" se expresa como una matriz
columna.
Algunas veces es tedioso introducir una nueva literal para denotar la matriz
estándar de una transformación lineal T:R" -+ R". En esos casos, la matriz estándar.para T se denota por el símbolo [q.Con esta notación, la ecuación (7) asume
la forma
T(x) = [ T ] x
(8)
Algunas veces se mezclan las dos notaciones para la matriz estándar, en cuyo caso
se tiene la relación
(9)
OBSERVACI~N. Entre toda esta notación es importante tener en mente que se ha
establecido una correspondencia entre las matrices m X n y las transformaciones
lineales de R" a Rm:a cada matriz A le corresponde una transformación lineal T,:
(multiplicación por A ) , y a cada transformación lineal T:R" "* Rm le corresponde
una matriz [qm X n (la matriz estándar para 7).
222
,;
Espacios vectoriales euclidianos
GEOMETRÍA DE
LAS TRANSFORMACIONES
LINEALES
Dependiendo de si las n-adas se consideran como puntos o comovectores,el
efecto geométrico de un operador TR" + R" es transformar cada punto (o vector)
en Rn en algún nuevo punto (o vector) (figura 1).
-
Figura 1
1
"-+
T mapea puntos en puntos.
-
T mapea vectoresen vectores
Ejemplo 3 Si O es la matriz cero m x n y O es el vector cero en R", entonces para
todo vectorx en R"
T,(X) = ox = o
de modo que la multiplicación por cero mapea cada vector de R" en el vector cero
en R". To se denomina transformación cero de R" a R". Algunas veces la
transformación cero se denota por O. Aunque esta e$ la misma notación que se usa
para indicar la matriz cero, la interpretación apropiada es evidente a partir del
contexto. A
Ejemplo 4 Si Z es la matriz identidad n x n, entonces para todo vector x en R"
T,(x)
= zx = x
de modo que la multiplicación por I mapea cada vector de R" en sí mismo. TI
se denomina operador identidad sobre R". Algunas veces el operador identidad se
denota por Z. Aunque esta es la misma notación que se usa para indicar la matriz
identidad, la interpretación apropiada es evidente a partir del contexto. A
Entre los operadores lineales más importantes sobre R2 y R3 están los que
producen reflexiones, proyeccionesy rotaciones. A continuación se analizarán esos
operadores.
OPERADORES
REFLEXI~N
Considerar el operador T:R2-R2 que transforma cada vector en su imagen simétrica con respecto al eje y (figura 2).
Si se hace w = T(x),entonces las ecuaciones que relacionan las componentes
dexywson
4.2 Transfornlacioneslineales de Rn a Rm / 223
w,= --x
u'2= y
+ oy
ox + y
= "x
=
4 Y
l
Figura 2
o bien, en forma matricial,
[:I
=
[-:, Y][ :1
Como las ecuaciones en (10) son lineales, T es un operador lineal y por (1 1) se
tiene que la matriz estándar para T es
En general, los operadores sobre R2 y R3 que transforman cada vector en su
imagen simétrica con respecto a alguna recta o algún plano se denominan operadores reflexiidn. Estos operadores son lineales. En las tablas 2 y 3 se enumeran algunos de los operadores reflexih comunes.
'ABLA2
224
i
Espacios vectoriales euclidianos
ABLA 3
Operador
Figura 3
Ecuaciones
Reflexión
respecto al
plano xy
w ,=
Keflexlón
respecto al
plano xz
w, =
Reflexión
respecto al
plano yz
OPERADORES
PROYECCIóN
Ilustración
w2 =
wg =
Matriz
estjadar
x
y
-2
x
w, = -y
wg = 2
w1=
"x
w, =
y
w3 =
z
Considerar el operador T:R2-.H2 que transforma cada vector en su proyección
ortogonal sobre el eje x (figura 3).
4.2 Transformaciones lineales de Rn a Rm / 225
Las ecuaciones que relacionan las componentes de x y w
w,=x=
w* =
= T(x) son
xfOy
o = ox + oy
o bien, en forma matricial;
[:I
=
[:, :][;I
Las ecuaciones en (12) son lineales, de modo que T es un operador lineal y por
(13) se tiene que la matriz estándar para T es
1 0
[T1=[0
o]
En general,un operador proyección (o másprecisamente,un
operador
proyección ortogonal) sobre R2 o R3 es cualquier operador que transforma
cada vector en su proyección ortogonal sobre una recta o un plano que pasan
por el origen. Es posible demostrar que estos operadores son lineales. En las
tablas 4 y 5 se enumeran algunos de los operadores proyección básicos sobre
R2 y R3.
MBLA 4
Ilustración
Operador
I
I
Proyección ortogonal
sobre el eje x
w, = x
I
Proyección ortogonal
I
I
,726
Espaciosvectorialeseuclidianos
TABLA 5
Operador
Matriz
estándar
Ilustración
Proyección ortogonal
sobre el plano xv
4'
Proyección ortogonal
sobre el plano xz
Proyección ortogonal
sobre el plano yz
Y
-__t
2
OPERADORES
ROTACI~N
Un operador que hace girar todo vector en R2 hasta describir un ángulo fijo se denomina operador rotacidn sobre R2. En la tabla 6 se enumeran los dos operadores
rotación básicos sobre R2. Para mostrar cómo se obtuvieron los resultados, considerar el operador rotación que hace girar en sentido contrario a las manecillas del
reloj cada vectorpor un ángulo positivo fijo 8. Para encontrar ecuaciones que
relacionen x y w = T(x), sea el ángulo del eje x positivo a x, y sea r la longitud
común de x y w (figura 4).
.
Figura 4
I
Entonces, por trigonometría básica,
x =r
cos 4,
y
=r
send
4.2 Transformacioneslineales de Rn a Rm / 227
Por medio delas identidades trigonométricas en (15) se llega a
w, = r cos O cos 4 - r sen8sen4
w,=rsenOcos ++reos Osen4
y sustituyendoen (14) se obtiene
w, =.xcos O-ysen8
w2=xsen8+ycos8
Las ecuaciones en (16) son lineales, por lo que T es un operador lineal; además;
con base en estas ecuaciones se concluye que la
matriz estándar para í"es
aciones
Operador
Rotación a través
de un ángulo 8
Matriz
estándar
Ilustración
W, = X C O S
(w1,
w2)
8-y
e
1
cos O
-sen O
8
cos 8
St\(&Y)
Ejemplo 5 Si cada vector en R2 se hace girar un ángulo n/6
imagen w de un vector es
Por ejemplo, la imagen del vector
x=
[:]
= (30°), entonces
la
228 ' Eipacios vectorzales euctidianos
es
Una rotación de vectores en R3 se describe, por lo general, en relación a un
rayo que parte del origen, denominado eje de rotación. A medida que un vector se
desplaza alrededor del eje derotación, describe una porción de un cono figura 5a).
E: ángulo de rotucidn, que se mide en la base del cono, se describe como "en
sentido del movimiento de las manecillas delreloj" o "en sentido contrario al
movimiento de las manecillas del reloj" en relación a un punto de vista situado a
lo largo del eje de rotación viendo hacia el origen. Por ejemplo, en la figura 5a, el
vector w resulta al hacer giraren sentido contrario al movimiento de las
manecillas del reloj alrededor del eje 1 el vector x hasta describir un ángulo 8. Así
como en R2, los ángulos son positivos si son generados por rotaciones en sentido
contrario al movimiento de las manecillas del reloj, y negativos si son generados
por rotaciones en sentido del movimiento delas manecillas del reloj.
La forma más común de describir un eje de rotación general es especificando
un vector u diferente de cero situado a lo largo del eje de rotación y cuyo punto
inicial está en el origen. La dirección en sentido contrario al movimiento de las
manecillas del reloj para una rotación alrededor del eje se puededeternlinar entonces mediante una "regla de la mano derecha" (figura 56); si el pulgar de la mano
derecha apuntaen la dirección de u, entonces los demás dedos apuntan en la
dirección opuesta al movimiento de las manecillas del reloj.
5
A"
I
Figura 5
Rotacidn en sentido contrario
a las manecillasdelreloj.
b)
(i I
Un operador rotucidn sobre R3 es un operador lineal que hace girar cada
vector en R3 alrededor de algún eje de rotación hasta describir un ángdo fijo 8.
En la tabla 7 se describen los operadores rotación sobre R3 cuyos ejes de rotación
son los ejes de coordenadas positivos. Para cada una de estas rotaciones, la
rotación deja sin cambio una de las componentes, y las relaciones entre las otras
componentes se pueden obtener con el mismo procedimiento usado para obtener
(16). Por ejemplo, en la rotación alrededor del eje z, las componentes z de x y w =
T(x) son las mismas, y las componentes x y y están relacionadas como en (16).
Esto conduce a las ecuaciones de rotación que se muestran en el último renglón de
la tabla 7.
4.2 Transformaciones lineales de R"
a Rm /
229
'ABLA 7
Operador
Matriz
estándar
Ecuaciones
Ilustración
Rotación en
sentido
contrario al
movimiento de
las manecillas
del reloj a través
de un á n a o
respecto al eje x
positivo.
w ,=x
O
w 2= y c o s 0 - z s e n 0
w 3 = y sen O + z
Rotación en
sentido
contrario al
movimiento de
las manecillas
del reloj por un
ángulo
respecto al eje y
positivo.
w 1= x cos O
tz
O
+ z sen0
cos 8 O
U'2 = y
=
Rotación en
sentido
Zontrario al
movimiento de
las manecillas
le1 reloj a través
le un ángulo
lespecto al eje z
~ositivo.
COS
-xsenO+zcosO
w ,= x c o s 0 - y s e n 0
t"
w2 = x s e n O + y c o s 0
wj = z
cos0
[se;
0
-
sen O
.:@I
sen0 O
p]
coi O
Por completitud, se observa que la matriz estándar para una rotación en
sentido contrario al movimiento de las manecillas del reloj alrededor de un eje en
R3 (detenninado por un vector unitario arbitrario u = (a, b, c) cuyo punto inicial
está en el origen) por un ángulo 8, es
a2(I - cos 8)
[
+ cos 8
ab(1 - cos 0)
-
c sen 0 ac(1
-
cos 0)
+ b sen8
ab(l-cos8)+csen8
b2(1-cose)+cos8
bc(l-cos~)-usen8
ac(1 - cos 0) - b sen O bc(1 - cos O ) + U sen 8 c2(1 - cos 0) + cos O
1
(1 7)
L a obtención de este hecho puede consul barse en el libro Yrincipies of Interactive
Computer Graphics, de W. M. Newrnan y R. F. Sproull, 'Nueva York, McGra\v-
... .
.
230
Espacios vectoriaies euclidianos
Hill, 1979. Es instructivo que el lector deduzca los resultados de la tabla 7 como
casos especiales de este resultado más general.
OPERADORES
DILATACION Y
CONTRACCIóN
Figura 6
Si k es un escalar no negativo, entonces el operador T(x) = kx sobre R2 o R3 se
denomina contracción con factor k si O Ik 5 1 y dilatacidn confactor k si k 2
1. El efecto geométrico de una contracción es comprimir cada vector por un factor
k (figura 6 4 , y el efecto de una dilatación es estirar cada vector por un factor k
(figura 66). Una contracción comprime R2 o R3 uniformemente hacia el origen
desde todas las direcciones, y una dilatación estira R2 o R3 umfonnemente lejos
del origen en todas ías direcciones.
U)
b)
O%k< 1
k> 1
La contracción más extrema ocurre cuando k = O, en cuyo caso T(x) = kx se
reduce al operador cero T(x)= O, que comprime cada vector a un simple punto el
origen). Si k = 1, entonces T(x) = b se reduce al operador identidad T(x)= x, que
deja sin cambio cada vector; esto se puede considerar como una contracción o
como una dilatación. En las tablas 8 y 9 se enumeran los operadores contracción y
Qlatación sobre R2 y R3.
4.2 Transformaciones lineales de R" a Rm / 231
'ABLA 9
Operador
Ilustración
Contracción con
factor k sobre R3.
t"
Ecuaciones
Matriz
estándar
w ,= kx
w2 = kY
w3 =
Dilatación con
factor k sobre R3.
kz
w , = kx
0
0
k
w2 = kY
w 3 = kz
COMPOSICIONES
DE TRANSFORMACIONES
LJNEALES
Si TA:Rn+ Rk y TB:Rk Rm son transformaciones lineales, entonces para todo x
en R~ primero se puede calcular lA(x), que es un vector en R ~ y, luego calcular
TB(TA(x)),que es un vector en Rm. Así, la aplicación de TA seguida de TB produce
una transformación de Rn a Rm. Esta transformación se denomina composición de
Ts con TA y se denota por TB TA (y se lee como 'ITA seguida de Tu"). Así,
0
La composición de TB 0 TA es lineal, ya que
( TB0 TA)(x)= TB(T,(x)) = B(Ax) = (BA)x
(19)
Demodo que TB 0 TA es la multiplicación por BA, que es una transformación
lineal. La fórmula 19) también establece que la matriz estándar para TB TA es
BA. Este hecho se expresa con la fórmula
0
OBSERVACI~N. La fórmula (20) encierra una idea importante: La multiplicacrón
de matrices es equivalente a componer las transformaciones lineales correspondientes enorden de derecha a izquierda delosfactores.
La fórmula (20) se puede escribir de otra manera: Si T,:R"+Rk y T2:Rk Rm
sontransformacioneslineales,entoncesdebido
a quela matriz estándarparala
composición T, TI es el producto de lasmatrices estándares paraT, y T I ,se tiene
0
232 / Espacios vectoriales euclidianos
Ejemplo 6 Sean T1:R2+ RZ y T2:R2+ R2 los operadores lineales que hacen girar
a los vectores por los ángulos O, y O,, respectivamente. Así, la operación
(T2 O
TI )(x> = T,(T,(x))
primero hace girar a x por un ángulo O,, luego hace girar a Tlx) un ángulo O,. Se
concluye que el efecto neto de T, o T , es hacer girar cada vector en R2 por el
ángulo O, + O, (figura 7).
Figura 7
Así. las matrices estándar para estos operadores lineales son
cos 8,
[
COS(O,
+ O,)
+ O,)
T2
-
1 = [,O2
-sen(8, + O,)
cos(8, + 8,)
sen 8,
cos 0,
1
Estas matrices deben satisfacer (21). Con auxilio de algunas identidades trigonométricas básicas se puede demostrar que lo anterior es como sigue:
4.2 Transformaciones lineales de R" a Rm / 233
Ejemplo 7 Sea T,:R2 + R2 el operador reflexión respecto a la recta y = x, y sea
T2:H2 + R2 la proyección ortogonal sobreel eje y. En la figura S se ilustra
grákamente que T,0 T2 y T2 0 T , tienen efectos distintos sobre un vector x. Esta
misma conclusión se puede obtener mostrando que las matrices estándar para T,y
T, no conmutan:
Figura 8
de modo que [ T, 0 TI ] # [ T I 0 T, 1. A
Ejemplo 8 Sea T,:R2 + R2 la reflexión respecto al eje y , y sea T2:R2 + R2 la
reflexiónrespecto al eje x. En este caso, T, T2 y Tz 0 T,son iguales; ambas
transforman cada vector x = (x,y ) en su negativo -x = ("x, -y) (figura 9):
0
t'
Figura 9
T2
T,
O
T2
t'
O
T,
233
/
Espacios vectoriales euclidianos
La igualdad de T , 0 T2 y T2 7 , también se puede deducir mostrando que
las matrices estándar para TI y T2 conmutan:
0
E I operador T(x) = "x sobre R2 o
se denomina reflexión respecto al origen.
Como se muestra con los cálculos anteriores. la matriz estándar para este operador
sobre R2 es
COMPOSICIONES DE TRES
o MÁS
TRANSFORMACIONES
LINEALES
Las composiciones sepueden definir para tres o más transformaciones linealcs.
Por ejemplo. considerar las transformaciones lineales
T,:R"+-R',
T,:Rk-+R',
La composición (T3 o T2 0 7,):Rn+ R" se define por
(T?" 7o,
Ti ) ( x ) == Ti(T(l T , ( X ) ) )
ES posible demostrar que esta composición es una transformación lineal, y que l a
matnz estándar para Tj T, 0 T , está relacionada con las matrices estándar para
T I , T, y T3 por
0
(22)
que es una generalización de (21). Si las matrices estándar para T,,I; 1; se
denotan por A , B y C, respectivamente. entonces también se tiene la sigulente
generalización de (20):
Solución. La transformación lineal 7 se puede expresar como la composición
4 . 2 Transformaciones lineales de Rn a Rm / 235
donde TA es la rotación respecto al eje
z, TB es la reflexión con respecto al plano
yz
y T, es la proyección ortogonal sobre el planoq.
De acuerdo con las tablas 3, 5 y
7, las matrices estándar para estas transformaciones lineales son
cos 0
-sen8
O
-1
o o
Así, por (22) la matriz estándar paraT es
EJERCICIOS DE LA SECCIÓN 4.2
1. Encontrar el dominio y el codominio de la trasformación defmida por las ecuaciones, y
determinar si la trasfonnación es lineal.
b) W, = ~ x , x-, x2
a) w ,= 3x, - 2x, + 4x3
~2 = 5x1 - 8x2 + x3
w2 = X I + 3x1x,
+
w, = x,
C) W , = SX, - x2
+
xj
d) W , =
X: 3x,
-
x2
+xi
- 2x4
w, = -x, + x, + 7x,
w, = 3x1 - 4x2 - .x: + xq
w j = 2x, - 4x2 - x3
2. Hallar la matriz estándar para la transformación lineal definida por las ecuaciones.
a) w ,= 2x, - 3x, + x,
b) wI = 7x, + 2x2 - 8x,
w2 = 3x, + 5x2 - x,
w, =
- x2 + 5x,
w, = 4x, + 7x2 - x j
c) w1 = -x, + x,
w, = 3x, - 2x2
d) w ,= x I
w, = x , + x2
w j = x , +x,+x,
w 4 = x , +x,+x3+x,
w3 = Sx, - 7s2
3. Determinar la matriz estándar para la transformación lineal TA3+ R3 definida por
w , = 3x,
+ SX,
-x3
w2 = $x, - x2 +x,
w3 = 3x,
+ 2x2 -x,
y calcular T( - 1,2,4) sustituyendo directamente en las ecuaciones y por multiplicación
matncial.
1
0
0
236 / Espacios vectoriales euclidianos
5. Encontrar la matriz estándar para la transformación lineal T definida por la fórmula
+
a) T ( x , , .x2) = (xz, - - S , , x i
3x,, xI - x2)
b) T(x-, , ,x2, ,uj, x4) = (7x, 2x2 -x3 .x4, x2 +x,, -.xi)
c) T ( x , , x2. X,) = (O, O, O, O, O j
+
+
d) TCu,, xZrx3,xq)= (x4. x I ,x j . x2, .xI
-xi)
6. En cada inciso se proporciona la matriz estándar [qde una transformación lineal T.
IJsar la matriz para encontrar í"(x). [Expresar la respuesta en forma matricial.]
7. I?n cada mciso, encontrar í"(x) usando la matriz para T, luego, comprobar el resultado
calculando directamente T(x).
a) T ( x , , x , ) = ( - x , + x , , x , ) ;
b) 7 ' ( ~ , ,~ 2 X,)
, = (2x1 - X >
x=(-1,4)
+~
3 x2
,
+ ,uj, O);
X
= (2, 1, - 3)
8. Por medio de la multiplicación matricial hallar la reflexión de ( - 1 , 2 ) respecto a
a) el ejex.
b) ejey.
el
c) la recta y = x.
9. Usar la multipiicación matricial para encontrar la reflexión de (2, -5, 3 ) respecto al
a) planoxy.
b) planoxz.
c) plano yz.
10. Mediante multiplicaci6n matricial obtener la proyección ortogonalde (2, - 5 ) sobre
b) el ejey.
a) el eje x.
11. Utilizar la multiplicación matricial para encontrar la proyección ortogonal de ( - 2 , 1,
3) sobre el
a) plano
x y .
b) plano xz.
c) plano yz.
12. Usar la multiplicación matricial para encontrar la imagen del vector (3, -4) cuando se
hace girar un ángulo de
a) 0 = 3 0 O
b) 8 = -60'
C) 0 = 4 5 O
d) 0 = 90°
13. Por medio de la multiplicación matnciai hallar la imagen del vector ( - 2 , 1, 2) si este
se hace girar
a) 30° en sentido contrario al movimiento de las manecillas del reloj con respecto al
eje x.
b) 4 5 O en sentido contrario al movimiento de las manecillas del reloj con respecto al
eje y .
c) 90° en sentido contrario al movimiento de las manecillas del reloj con respecto al
eje z.
14. Encontrax la matrrz estándar para el operador lineal que hace girar un vector en R3 en
sentido del movimiento de las manecillas del reloj hasta describir un ángulo de -60'
con respecto al
a) eje x.
b) eje y .
c) eje z.
4.2 Transformaciones lineales de R"
15. Usar multiplicación matricial para encontrar la imagen del vector (-2, 1, 2) si éste se
hace girar
a) -30° en sentido del movimiento de las manecillas del reloj con respecto al eje x.
b) -45O en sentido del movimiento de las manecillas del reloj con respecto al eje y .
c) -90° en sentido del movimiento de las manecillas del reloj con respecto al eje z.
16. Encontrar la matriz estándar para la composición de operadores lineales sobre R2 que
se indica.
a) Una rotación de 90° en sentido contrario al movimiento de las manecillas del reloj,
seguida de una reflexión con respecto a la rectay = x.
b) Una proyección ortogonal sobre el eje y , seguida de una contracción con factor k =
1
-
2 '
c) Una reflexión con respecto al eje x, seguida de una dilatación con factor k = 3 .
17. Encontrar la m a w estándar para la composición de operadores lineales sobre R2 que
se indica.
a) Una rotación de 60° en sentido contrario al movimiento de las manecillas del reloj,
seguida de una proyección ortogonal sobre el eje x, seguida de una reflexión con
respecto a la recta y = x.
b) Una dilatación con factor k = 2, seguida de una rotación de 45O en sentido contrario
al movimiento de las manecillas del reloj, seguida de una reflexión con respecto al
eje y .
c) Una rotación de 15O en sentido contrario al movimiento de las manecillas del reloj,
seguida de una rotación de 105Oen sentido contrario almovimiento de las manecillas del reloj, seguida de unarotación de 60° en sentido contrario al movimiento de las manecillas del reloj.
de operadores lindes sobre R3 que se
indica.
a) Una reflexión respecto al plano yz, seguida de una proyección ortogonal sobre el
plano x z .
b) Una rotación de 45O en sentido contrario al movimiento de las manecillas del reloj
18. Encontrar la malriz estándar para la composición
respecto al eje y , seguida de una dilatación con factor k = fi .
c) Una proyección ortogonal sobre el plano q ,seguida de una reflexión con respecto
al plano yz.
19. Encontrar la matriz estándar para la composición de operadores lineales sobre R3 que
se indica.
a) Una rotación de 30' en sentido contrario al movimiento de las manecillas del
reloj respecto al eje x, seguida de una rotación de 30' en sentido contrario al
movimiento de las manecillas del reloj respecto al eje z, seguida por una contracción con factor k =
b) Una reflexión respecto al plano x y , seguida de una reflexión respecto al plano x z ,
seguida de una proyección ortogonalsobre el planoyz.
c) IJna rotación de 270' en sentido contrario al movimiento de las manecillas del
reloj respecto al eje x, seguida de una rotación de 90' en sentido contrario al movimiento de las manecillas del reloj respecto al eje y , seguida de una rotación de
180' respecto al eje z.
+
a Rm /
237
,738
Espacios vectoviales euclidianos
20. Determinar si T , K2 = T, O TI.
a) 7, : R' -+ X
' es l a proyección ortogonal sobre el eje x y T 2 X 2 += R2 es la proyección
ortogonal sobre el ejey .
b) 7 , . R' += R' es la rotación en sentido contrario al movimiento de las manecillas del
reloj hasta describir un ángulo 8, y Tz : R2 R2 es la rotación en sentido contrario
al movimiento de las manecillas del reloj hasta describir un Angulo
c) T I R2 += R2 cs l a reflexión respecto al eje x y 7; : R2 += R2 es la reflexión respecto
al ejey .
d) T I : R' + H' es l a proyección ortogonal sobre el eje x y T2 : H' -+ R' es la rotación
en sentido contrario ai movimiento de las manecillas del reloj hasta describir un
Lingulo O.
U
-+
T,
21. Detenninar si
o 7; = 1- o 7'
1.
a)
: K3 += R 3 cs &a dhatación con factor k y 7, : R 3
7,
+ R3 es la rotación en sentido
contrarioal movimiento de las manecillasdelreloj
con respectoal eje z hasta
describir un ángulo
b) T , . R' .+ R3 es la rotación con respecto al eje x hasta describir un ángulo 8, y
T2 : K' -+ R3 es la rotación con respecto al eje z hasta describir un ángulo O,.
22. En R3,las proyecciones ortogonales sobre el ejex, el eje y y el eje z se definen como
respectivamente.
a) Demostrar quelas proyecciones ortogonales sobrelos ejesde coordenadas son
operadores lineales y encontrar sus matnces estándar.
b) Demostrar que si TR3 + R3 es una proyección ortogonal sobre uno de los ejes de
coordenadas, entonces para todo vector x en R3 los vectores T ( x ) y x - T ( x ) son
ortogonales.
c) Hacer una figuramostrando x y x - T(x) en elcasoen que T es la proyección
ortogonal sobre el eje x.
23. A partir de la fórmula (1 7), obtener las matnces estándar para las rotaciones en sentido
contrario al movimiento de las manecillas del reloj respecto al eje x, al ejey y al eje z
en R3
24. Usar la fórmula (17) paraencontrar
la matnz estándar de una rotación de 90° en
sentido contrario al movimiento de las manecillas del reloj respecto al eje determinado
por el vector v = ( 1, 1, 1). [Nota La fórmula (1 7) requiere que la longitud del vector
que define el eje de rotación sea 1.]
25. Comprobar la fórmula (21) para las transformaciones lineales dadas.
a) TI@,,x,) = ( s i + x , , x I - .y2)
b) T , ( x , ..x2) = (4u1, -2s, +.Y,,
c) T , ( x , ,S ? , .x3) = ( - x 1
( - 2 . x , , 3x3, - 4x,)
+ x2, "Y>
y T2(xl, x2) = (3.x,, 2 r I + 4*,)
- 3x2) y T,(-~l,xz,x3)
=(.Y,
+ x j , - x 3 + X i ) y T2(.Xl, x 2 ,
-xI
+ 2.r2 - x 3 ,
Xj)
=
41, - x j )
4.3 Propiedades de las transformaciones lineales de Rn a Rm / 239
26. Se puede demostrar que si A es una matriz 2 X 2 con det(A) = 1 y tal que los vectores
columna de A son ortogonales y tienen longitud 1, entonces la multiplicación por A es
una rotación en sentidocontrario al movimiento delas manecillasdelrelojhasta
describir algún ángulo O. Comprobar que
satisface las condiciones planteadas y encontrar el ángulo de rotación.
27. El resultado del ejercicio 26 también es verdadero en R3: se puede demostrar que si A
es una matriz 3 X 3 con det(A) = 1 y tal que los vectores columna de A son ortogonales
por parejas y tienen longitud 1, entonces la multiplicación por A es una rotación en
sentido contrario al movimiento de las manecillas del reloj con respecto a algún eje de rotación hasta describir algún ángulo O. Usar la fórmula (1 7)para demostrar que si A satisface las condiciones establecidas, entonces el ángulo de rotación satisface la ecuación
tr(A) - 1
2
28. Sea A una matriz 3 X 3 que satisface las condiciones planteadas en el ejercicio 27. Se
puede demostrar que si x es cualquier vector en R3, entonces el vector
cos 0 =
~
u = A x +ATx
+ [ 1 - tr(~)]x
determina un eje de rotación cuando u se coloca con su punto inicial en el origen. [Ver
The Axis of Rotation:Analysis, Algebra, G e o m e t y , de Dan Kalman, Mathematics Magazine, Vol. 62, No. 4, Oct. 19891.
a) Demostrar que la multiplicación por
es una rotación.
b) Encontrar un vector de longitud 1 que defina un eje de rotación.
c) U s a r el resultado del ejercicio 27 para encontrar el ángulo de rotación en sentido
contrario al movimiento de las manecillas del reloj alrededor del eje obtenido en el
inciso b).
4.3
PROPIEDADES DE LAS TRANSFORMACIONES LINEALES DE R n A Rm
En esta sección seestudiará la relación entre la invertibilidad deuna matriz y las
propiedades de la transformación matricial correspondiente. También se obtendrá una representación de las transformaciones lineales de R" a Rm que constituyen la base paratransformaciones lineales más generales que se analizarán en
seccionesulteriores, y se estudiaránalgunas propiedades geométricas de los
eigenvectores.
240 / Espacios vectoriales euclidianos
TRANSFORMACIONES
LXNEALES UNO
A UNO
Las transformaciones lineales que mapean vectores (o puntos) distintos en
vectores (o puntos) distintos revisten especial importancia. Un ejemplo es el
operador lineal T:R2 + R2 que hace girar cada vector hasta describir un hngulo B.
Geométricamente resulta evidente que si u y v son vectores distintos en R2,
entonces también los vectoles girados T(u) y T(v) son distintos (figura 1).
AI y
Figura 1
*Tív)
I Vectores distintos u Y Y se mueven hacia vectores distintos T(u) Y Tlvl I
En contraste, si TR' "* R3 es la proyección ortogonal de R3 sobre el plano
entonces puntos dlstintos sobre la misma recta vertical son mapeados en el
mismo punto del plano xy (figura 2).
xy,
P
Y
Figura 2
ILos puntos distintos P y Q son mapeados en el mismo punto M. I
Definición. Se dice que una transformación lineal T:R" + R"' es uno a uno si T
mapea vectores (puntos) distintos de R" en vectores (puntos) distintos de R"'.
OBSERVACI~N. A partir de esta definición se concluye que para todo vector w en
el recorrido de una transformación lineal T uno a uno, existe exactamente un
vector x tal que T(x) = w.
Ejemplo 1 En términos de la definición anterior, el operador rotación de la figura
1 es uno a uno, pero el operador proyección ortogonal de la figura 2 no lo es.
-
Sea A una matriz n x n, y sea TA:R" R"' la multiplicación por A . A continuación se analizarán las relaciones entre la invertibilidad de A y las propiedades
de TA.
Recordar del teorema 2.3.6 (con w en lugar de b) que las siguientes proposiciones son equivalentes:
4.3 Propiedades de las transformaciones lineales de R" a Rm 1 241
A es invertible
Ax = w es consistente para toda matriz w n X 1.
Ax = w tiene exactamente una solución para toda matriz w n
X
1.
Sin embargo, la última de las proposiciones anteriores es realmente más definitiva
que lo necesario. Sepuede demostrar que las siguientes proposiciones son
equivalentes (ejercicio 24):
A es invertible.
Ax = w es consistente para toda matriz w n X 1.
Ax = w tiene exactamente una solución cuando el sistema es consistente.
Al traducir l o anterior en proposiciones correspondientes respecto al operador lineal TA,se deduce que las siguientes proposiciones son equivalentes:
A es invertible.
* ' Para todo vector w en R", existe algún vector x en R" tal que TA(x)= w.
Expresado de otra forma, el recorrido de TA es todo R".
Para todo vector w en el recorrido de TA, existe exactamente un vector x
en R" tal que TA(x)= w. Planteado de otra forma, TA es uno a uno.
En resumen, se ha establecido el siguiente teorema acerca de los operadores
lineales sobre R".
Teorema 4.3.1. Si A es una matriz n
X
n y TA:R" + Rn es la multiplicación por
A, entonces las siguientes proposiciones son equivalentes.
a) A es invertible.
b) El recorrido de TA es R".
c) TA es uno a uno.
Ejemplo 2 En' el ejemplo 1 se observó que el operador rotación T:R2 --* R2 ilustrado en la figura 1 es uno a uno. Por el teorema 4.3.1 se concluye que el recomdo
de T debe ser todo R2, y que la matriz estándar para T debe ser invertible. Para
probar que el recomdo de T es todo R2 es necesario demostrar que todo vector en
R2 es la imagen de algún vector x bajo T. Pero claramente este hecho es así, ya que
el vector x que se obtiene al hacer girar w hasta describir el ángulo -O lo transforma en w cuando se hace girar el ángulo O. Además, por la tabla 6 de la sección
4.2, la matriz estándar para T es
que es invertible, ya que
,742
Espaciosvectoriales euclldianos
Ejemplo 3 En elejemplo 1 se observó que el operador proyección T:R3 + R3
ilustrado en la figura 2 no es uno a uno. Del teorema 4.3.1 se deduce que el
recorrido de T no es todo R3 y que la matriz estándar para T no es invertible. Para
mostrar que el recorrido de T no es todo R3, es necesario encontrar un vector w en
X3 que no sea la imagen de ningún vector x bajo T. Pero cualquier vector w fuera
del plano xy posee esta propiedad, ya que todas las imágenes bajo T están en el
plano xy. Además, por la tabla 5 de la sección 4.2, la matriz estándar para T es
que no es invertible. ya que det
INVERSA DE UN
OPERADOR
LINEAL UNO A
UNO
[g=O.
A
Si TA:K" + R" esun operador lineal uno a uno, entonces por el teorema 4.3.1 la
matriz A es invertible. Así, TA-':Rn-+ R" por sí mismo es un operador lineal; se
denomina inverso de TA.Los operadores lineales TA y TA-, se cancelan entre sí en
el sentido de que para todo x en R"
7-,(r,
I(
,(x)) = A'4
Tq(x)) = A
-
' x = Ix = x
' A x = fx
=X
o. equivalentemente,
1
=
TI
T A = T A - 1A
=
TI
T A o TA-1 == T A A T A
-
I 0
Desde un punto de vista más geométrico, si w es la imagen de x bajo TA, entonces
TA-, transforma de vuelta w en x , ya que
Figura 3
X
__
"
I
4.3 Propiedades de las transformaciones lineales de R" a Rm / 243
Antes de presentar un ejemplo, será de utilidad mencionar algo sobrela
notación. Cuando un operador lineal uno a uno sobre R" se escribe como ZRn "*
R" (en vez de TA:Rn+ R"), entonces el inverso del operador T se denota por T " l
(en vezde TA-,). Como la matriz estándar de T" es la inversa dela matriz
estándar para T, se tiene
u
[ T"
] = [ TI"
Ejemplo 4 Sea T R 2 + R2 el operador que hace girar cada vector de R2 hasta describir el ángulo 0; de modo que por la tabla 6 de la sección 4.2
['
1
=
1
COS 8 -sen8
[seno
cos 0
Geométricamente es evidente que para deshacer el efecto de T es necesario hacer
girar cada vector de R2 por un ángulo -0. Pero esto es exactamente lo que hace el
operador T- I , ya que la matriz estándar para T- es
cos( - 8) -sen( - 8)
sen(- 8)
cos( - 8)
[T"]=[T]"=
(comprobar), que es idéntica a (2), excepto que se sustituye por -0.
A
Ejemplo 5 Demostrar que el operador lineal T:R2 + R2 definido por las ecuaciones
w , = 2x, + x2
w, = 3x1 + 4x,
es uno a uno, y encontrar T " ( W ~ , w2).
Solución. La forma matricial de estas ecuaciones es
de modo que la matriz estándar para T es
Esta matriz es invertible (de modo que T es uno a uno), y la matriz estándar
para T" es
244
Espaclos vectorxales euclidianos
Así,
a partir de lo cual se puede deducir que
T '(M.,
,
PROPIEDADES
DE
LA
LINEALIDAD
($w,
-.
6w2, -?M>,
+gw2)
A
En la sección precedente, una trasformación TR" R" se definió como lineal si
las ecuaciones que relacionan a x y a w = T(x) son lineales. El siguiente teorema
proporciona otra representación de la linealidad. Este teoremaes fundamental y
constituye la base para extender el concepto de transformación lineal a casos más
generales que se presentarán después en el texto.
+
~~
~~~
~~~~
R" es lineal si y sólo si las siguientes relaciones se cumplen para todos los vectores u y v en R" y cualquier
escalar c.
( I ) T(u + v ) = T(u) + T(v)
h ) T(cu)= cT(u)
Teorema 4.3.2. Una trasformación T:R"
-+
I
Demostración. Primero se supone que T es una transformación lineal, y se hace
que A sea la matriz estándar para T.Por las propiedades aritméticas básicas de las
matrices se concluyeque
T(u + v)
= A(u
+ v) = Au + A v
=
T(u) + T(v)
Y
T(cu) = A(cu) = c('4u) = cT(u)
Recíprocamente, se supone que la trasformación T satisface las propiedades a) y
b). Sepuede demostrar que 7' es lineal si se encuentra una matriz A con la
propiedad
T ( x )= Ax
(31
para todos los vectores x en R". Conlo anterior se demuestra que T es la
multiplicación por A y, en consecuencia, que es lineal. Pero antes de poder obtener
esta matriz es necesario observar que la propiedad a) se puede extender a tres o
4.3 Propiedades de las transformaciones lineales de R" a Rm / 245
más términos; por ejemplo, si u, v y w son vectores cualesquiera en R", entonces
agrupando primero v y w y aplicando la propiedad u) se obtiene
T(u + v
+ w) = T(u + (v + w)) = T(u) + T(v + w) = T(u) + T(v)+ T(w)
Más generalmente, para vectores cualesquiera Y , , v2, . . . , Vk en R". se tiene
T(v, t v2
+ . . + V k ) = T(v,) + T(v,) + . . . + T ( V k )
I]
'
Luego, para encontrar la matriz A , sean e l , e 2 ., . . , en los vectores
e, =
, e2
=
y sea A la matriz cuyosvectores columna consecutivos son T(el), T(e2), . .
T(e,); es decir,
.
,
Si
x=
es cualquier vector en R", entonces como se analizó en la sección 1.3, el producto
Ax es una combinación lineal de los vectores columna de A con coeficientes de x,
de modo que
con lo que se completa la demostración. 0
La Expresión (5) es importante por derecho propio, ya que constituye una
fórmula explicita con la cual la matriz esthadar para un operador lineal TR'' -+ Rm
se puede expresar en términos de las imágenes de los vectores e,, e2. . . . , e, bajo
T. Por razones que serán analizadas después, los vectores el, e2' . . . . e, en (4) se
246 ,' Espacios vectoriales euclidianos
denominan vectores estándar brisicos para R". En R2 y R3 se trata de los vectores
de longitud 1 situados a lo largo de'los ejes de coordenadas (figura 4).
I ase normal para 1
Figura 4
P .
Debido a su importancia, la expresión (5) se planteará como teorema para
fines de referencias futuras.
Teorema 4.3.3. Si TR" + Rm es una transformación lineal y el, e2, . , en
son los vectores estrindar. brisicos para R", entonces la matriz estándar para 7
es
,
,
La fórmula (6) es un medio eficaz para encontrar matrices estándar y anal i z a el efecto geométrico de una transformación lineal. Por ejemplo, suponer que
T:R3 * R3 es la proyección ortogonal sobre el plano x y . Con referencia a la figura
4, geométricamente es evidente que
It]
de modo que por (6)
[TI=[:
lo que concuerda con el resultado de la tabla 5.
Usando (6) de otra forma, suponer que TA:R3-+R2 es la mUltipliCaCiÓn Por
-1
A = [
3
2
1
o
61
4.3 Propiedades de las transforrnaciones lineales de R” a Km / 247
Las imágenes de los vectores estándar básicos se pueden leer directamente de las
columnas de lamatriz A :
Ejemplo 6 Sea I la recta en el plano xy que pasa por el origen y forma un ángulo
con el eje x positivo, donde O 5 8 < n.Como se ilustra en la figura 5a, sea T:R2
R2 el operador lineal que transforma cada vector en su proyección ortogonal
sobre 1.
-
a) Encontrar la matriz estándar para T.
b) Encontrar la proyección ortogonal del vector x = (1, 5 ) sobre la recta que pasa
por el origen y forma un ángulo 8 = n/6 con el eje x positivo.
Solución de a). De (6),
[ T I = [ í Y e , ) I T(e,)l
donde el y e2 son los vectores estándar básicos para R2. Se considerará el caso en
que O 5 8 5 n12;el caso en que n12 < 8 < 7t es semejante. Con referencia a la
figura 5b, se tiene IIT(el)ll = cos 8, de modo que
cos2 H
y con referencia a la figura 5c, se tiene IIT(e2)ll=sen 6, de modo que
Así, la matriz estándar para I’ es
248
1'
Icspacios vectoriales euclidianos
[ TI =
i
cos' H
sen0 cos O
sen O cos
sen28
1
Solucicin de b). Como sen nI6 = 112 y cos n/6 = f i I 2 , por el inciso a) se concluye que la matriz estándar para este operador proyección es
Así,
3+5v3
4
f i + 5
4
o bien, en notación horizontal.
INTERPRETARecuérdese de la sección 2.3 que si A es una matriz n x n, entonces se denomina
CIÓN GEOMÉeigenvalor de A si existe unvector x diferente de cero tal que
TRICA DE LOS
EIGENVECTORES
Ax = Ax o equivalentemente (AI - A)x = O
Los vectores x diferentes de cero que satisfacen esta ecuación se denominan eigenvectores de A correspondientes a 1.
Los eigenvalores y eigenvectores también se pueden definir para operadores
lineales sobre R"; estas definiciones son paralelas a las definiciones correspondientes para matrices.
Definición. Si T:Rn+ Rn es un operador lineal, entonces el escalar
se denomina eigenvalor de T si en R" existe un x diferente de cero tal que
T(x) = Ax
(7)
Los vectores x diferentes de cero que satisfacen esta ecuación se denominan
eigenvectores de T correspondientes a1.
Observar que si il es la matriz estándar para T, entonces (7) se puede escribir
como
A X = AX
de donde se deduce que
4.3 Propiedades de las transformaciones lineales de Rn a RIn / 249
Los eigenvalores de T son precisamente los eigenvalores desu matriz
estándar A.
x es un eigenvector de T correspondiente a il si y sólo si x es un eigenvector de A Correspondiente a A.
Si 1 es un eigenvalor de A y x es un eigenvector correspondiente, entonces
A x = Ax, de modo que la multiplicación por A transforma x en un múltiplo escalar
de sí mismo. En RZ y R3, esto significa que la multiplicación por A transforma
cada eigenvector x en un vector que está sobre la misma recta que x (figura 6).
Figura 6
Recuérdese de la sección 4.2 que si il IO, entonces el operador lineal Ax = 1
x comprime a x por un factor 1 si O I1 I 1 o estira a x por u11 factor 1 si A 2 1.
Si 1 < O, entonces A x = Ax invierte la dirección de x, y comprime elvector
invertido por un factor IA I si O I11 I I1 o estira el vector invertido por un factor
si 1 (figura 7 ) .
Figura 7
osas1
a21
- 1 ~ a s o
a s -I
Ejemplo 7 Sea T:R2 + R2 el operador lineal que hace girar cada vector un ángulo 8. Geométricamente es evidente que a menos de que 8 sea un múltiplo de n,
entonces T no transforma ningún vector x uerente de cero sobre la misma recta
que x; en consecuencia, T no tiene eigenvalores reales. Pero si 8 es unmúltiplo de
n,entonces todo vector x diferente de cero es transformado sobre la misma recta
que x, demodo que todo vector diferente de cero es un eigenvector de T. A
continuación se comprobarán algebraicamente estas observaciones geométricas. La
matriz estándar para T es
A = [ cos O
sen0
1
-sen0
cos 8
250 / Espacios vectoriales euclidianos
Como se analizó en la sección 2.3, los eigenvalores de esta matriz son las soluciones de la ecuación característica
det(AZ - A ) =
A - cos 0
-sen 0
sen 0
A - cos 0
es decir.
(a - COS
t sen2 O = O
(8)
Pero si 8 no es un múltiplo de n,entonces sen2 8 > O, de modo que esta ecuación
no tiene solución real para y, en consecuencia, A no tiene eigenvectores reales.*
Si 6 es un múltiplo de n,entonces sen 8 = O y cos 6 = 1 o cos 6 = - 1, dependiendo del múltiplo particular de n.En el caso en que sen 8 = O y cos 8 = l, la
ecuación característica (8) se vuelve (A - 1)2 = O: de modo que ;1 = 1 es el Único
eigenvalor de A. En este caso, la matriz A es
Así, para todo x en R2,
T(x)= A x =/x = x
de modo que T transforma todo vector en sí mismo y, por tanto, en la misma recta.
En el caso en que sen 6 = O y cos 6 = -1, la ecuación característica
(8) se
vuelve (A + 1)2 = O, de modo que A = - 1 es el Único eigenvalor de A. En este caso,
la matriz de A es
Así, para todo x en R 2 ,
T(x)= i i x
=
-1x
= "x
*Existen aplicaciones que requieren escalares complejos y vectores con componentes complejas. En
talescasossonpermisibles
los eigenvalorescomplejos
y los eigenvectoresconcomponentes
complejas.Sinembargo,estehechocarece
de importanciageométricadirectaaquí.Encapítulos
ulterioresseanalizarántaleseigenvalores
y eigenvectores,perohastaqueexplícitamente
se
establezca lo contrario, se supondrá que se considerarán sirlo eigenvalores reales y eigenvectores con
componentes reales.
4.3 Propiedades de las transformaciones lineales de R" a Rm / 251
Ejemplo 8 Sea T:R3 -* R3 la proyección ortogonalsobreelplano
xy. Los
vectores en el plano xy son transformados en sí mismos bajo T, de modo que
todo vector diferente de cero en el plano xy es un eigenvector correspondiente
al eigenvalor 1 = 1. Todo vector x a lo largo del eje z es transformado en O
bajo T, que está en la misma recta quex, de modo que todo vector diferente de
cero sobre el eje z es un eigenvector correspondiente al eigenvalor A = O. Los
vectores que no están en el plano xy o a lo largo del eje z no son transformados en múltiplosescalaresdeellos
mismos, de modo que no existenotros
eigenvectores o eigenvalores.
Para comprobar algebraicamente estas observaciones geométricas, recordar
de latabla 5 de la sección 4.2 que la matriz estándar para T es
La ecuación característica de A es
o
A-1
det(AZ - A ) =
o
a-]
O
O
o
o =o
h
O
cuyas soluciones1 = O y 1 = 1 ya se anticiparon.
Como se analizó en la sección 2.3, los eigenvectores de la matriz A correspondientes a un eigenvalor A son las soluciones diferentes de cero de
Si A = O, este sistema es
[-;-A
O
:][:;I =[!I
0
x3
cuyas soluciones son x1 = O, x2 = O, x3 = t (comprobar), o bien, en forma matricial,
Como ya se había anticipado, estos son los vectores a lo largo del eje t. Si ,
I=' 1,
entonces el sistema (9) es
252 / Espacios vectorialeseuclidianos
cuyas soluciones son x,
= S, x2 = t, x3 = O
(comprobar), o bien, en forma matricial,
Como ya se había anticipado, estos son los vectores en el plano x y . A
RESUMEN
En el teorema 2.3.6 se presentó una lista con seis resultados que son equivalentes
a la invertibilidad de una matriz A. Esta sección concluye agregando el teorema
4.3.1 a esa lista, para obtener el siguiente teorema que relaciona todos los temas
principales estudiados hasta el momento.
1
Teorema 4.3.4. Si A es una matriz n x n, y si TA:R" + R" es la multiplicación
por A , entonces lassiguientes proposiciones son equivalentes.
a) A es invertible.
b) A x = O sólo tiene la solución trivial.
cf La forma escalonada reducida de A es In.
(0 A se puede expresar como un producto de matrices elementales.
e) AH = b es consistente para toda matriz b n X 1.
8 AH = b tiene exactamente una solución para toda matriz b n X 1.
gj det4) # O .
h) El recorrido de TA es R".
i ) T,es uno a uno.
EJERCICIOS DE LA SECCION 4.3
1. Por inspección, determinar si el operador lineal es uno a uno
La proyección ortogonalsobre el eje x en R2.
La reflexión respecto al eje y en R2.
La reflexión respecto a la rectay = x en R2.
Una contracción con factor k > O en R2.
Una rotación alrededor del eje z en R3.
f, Una reflexión respecto al plano xy en R3.
g) Una dilatación con factor k > O en R3.
a)
b)
c)
d)
e)
2. Encontrar la matriz estándar del operador lineal definido por las ecuaciones y usar el
teorema 4.3.1 para determinar si el operador es uno a uno.
a) w I = Sx, + 4x2
b) w I = 2x, - 3x,
c) w I = -xi + 3x, + 2x3
d) u', = X, + 2x2 + 3x3
w 2 = ZX, + x2
w2 = 5x, + x2
w 2= ZX,
+ 4x3
w 2 = 2x, i51, -t 3s3
w 3 =
x! + 3x2 + 6x3
kv3 = x1
+ 8x3
4.3 Propiedades de las transformaciones lineales de Rn a Rm / 253
3. Demostrar que el recorrido del operador lineal defindo por las ecuaciones
w , = 4x, - 2x2
w2 = 2x,
-
x2
no es todo de R2, y encontrar ULI vector que no esté en el recorrido
4. Demostrar que e! recorrido del operador lineal definido por las ecuaciones
w,= x, - 2x2+- x3
w2 = 5x, - x2 + 3x,
w, = 4x, + x2 + 2x,
no es todo de R3, y encontrar un vector que no esté en el recorrido.
5. Determinar si el operador lineal T : R2 + R2 definido por las ecuaciones es uno a
uno; en caso afirmativo, encontrar la matriz estándar para el operador inverso, y
encontrar ~ " ( w ~wz).
,
a) w,= x, + 2x2
b) w ,= 4x, - 6x2
c) w 1= -x2
d) w,= 3x,
w2= -x, + x2
w2 = - 2x, + 3x2
w2 = -x,
w 2= -5x,
6. Deteminar si el operador lineal T : R3 + R3 definido por las ecuaciones es uno a uno,
en caso afirmativo,encontrar la matrizestándar para el operador inverso, y
encontrar ~ " ( w ~w2,
, w3).
a) w ,= x, - 2x2
w2 = 2x,
.x2
w j = x,
x2
+
+ 2x,
+
x3
+
c) w ,= S,+ 4x2 - x,
w, = 2x, + 7x2 + x,
w3 = x, + 3x2
b) w ,=
x,
w 2 = -x,
w, =
d) w ,=
3x2 + 4x,
x2 + xj
- 2x2 f 5x3
-
+
x,+ 2x, + x,
+ x2 + 4x,
w* = -2x,
w3 = 7x,
+ 4x2 - 5x3
7. Por inspección, determinar el inverso del operador lineal uno a uno dado.
a)
b)
c)
d)
e)
La reflexion respecto al eje x en R ~ .
La rotación por un ángulo de x14 en R2.
La dilatación por un factor de 3 en R2.
La reflexión respecto al plano yz en R3.
La contracción por un factor de en R3.
En los ejercicios 8 y 9, aplicar el teorema 4.3.2 para determinar si T : R2 + R2 es un operador lineal.
10. a) T(x,y,z)=(x,x+y+z)
11. a) T(x, y, z) = (O, O)
b) T ( x , y , z ) = ( l , l )
b) T(x, y, z) = (3x - 4y, 2x
-
52)
254 / Espacios vectoriales euclidianos
12. En cada inciso, usar el teorema 4.3.3 para encontrar la matriz estándar del operador
lineal a partir de las imágenes de los vectores estándar básicos.
a) Los operadores reflexión sobre R2 en la tabla 2 de la sección 4.2.
b) Los operadores reflexión sobre R3 en la tabla 3 de la sección 4.2.
c) Los operadores proyección sobre R2 en la tabla 4 de la sección 4.2.
d) Los operadores proyección sobreR3 en la tabla 5 de la sección 4.2.
e) Los operadores rotación sobre R2 en la tabla 6 de la sección 4.2.
f, Los operadores dilatación y contracción sobreR3 en la tabla 9 de la sección 4.2.
13. Aplicar el teorema 4.3.3, para encontrar la matriz estándar de TR2 R2 a partir de las
Imágenes de los vectores estándar básicos.
a) TB2 +. R2 proyecta un vectorortogonalmentesobreel eje x y luego refleja ese
vector respecto al ejey.
b) T:R2 +. R2 refleja unvector respecto a la recta y = x y luego refleja ese vector
respecto al eje x.
c j 7R2 + R2 dilata un vector por un factor de 3 , luego refleja ese vector respecto a la
recta y = x, y luego proyectaese vector ortogonalmente sobre el
eje y .
14. Aplicar el teorema 4.3.3 para hallar la matriz estándar de TR3 + R3 a partir de las
imágenes de los vectores estándar básicos.
a) TR3 +. R3 refleja un vector respecto al plano xz y luego contrae ese vector por un
factor de 1/5.
b) 7R3+. R3 proyecta un vector ortogonalmente sobre el plano xz, y luego proyectaese
vector ortogonalmentesobre el plano x y .
c) TB3+. R3 refleja un vector respecto al plano x y , luego refleja ese vector respecto al
plano xz, y luego refleja ese vector respecto al planoyz.
15. Sea TAR3 + R3 la multiplicación por
y Sean e , , e2 y e3 10s vectores estándar básicos para R3. Encontrar por inspección los
siguientes vectores.
.a) &(e,), U e A y U e 3 )
b) U e , + e2 + e 3 j
c) TA(7e3)
16. Determinar si la multiplicación por A es una transformaciónlineal uno a uno.
17. Usar el resultado del ejemplo 6 para encontrar la proyección ortogonal de x sobre la
recta que pasa por e1 origen y forma un ángulo 8 con el eje x positivo.
a) x = ( - l , 2 ) ; 0 = 4 5 "
b) x = ( l , O ) ; 0 = 3 0 "
cx) = ( l , 5 ) ;
18. Aplicar el tipo de razonamiento proporcionadoenelejemplo
O = 120"
8 para encontrar los
eigenvalores y los eigenvectores correspondientes de T. Verificar las conclusiones
calculando los eigenvalores y los eigenvectores correspondientes a partir de la matriz
estándar para T.
a) TR2 +. R2 es la reflexión respecto al eje x.
b) TR2+. R2 es la reflexión respecto a la recta y = x.
4.3 Propiedades de las transformaciones lineales de R" a Rm / 255
c) TR2+ R2 es la proyección ortogonal sobreel eje x .
d) 7'B2+ R2 es la contracción por un factor de .
i9. Seguir las indicaciones del ejercicio 18.
a) T:R3+ R3 es la reflexión respecto al plano yz.
b) TR3+ R3 es la proyección ortogonal sobreel plano xz.
c) TR3+ R3 es la dilatación por un factor de 2.
d) T R 3 + R3 es una rotación de 4.5' en sentido contrario al movimiento de las manecillas del reloj alrededor del eje z.
20. a) ¿Es uno a uno la composición de transformaciones lineales uno a uno? Justificar la
conclusión.
b) ¿Es posible que la composición de una transformación lineal uno auno y una transformación lineal no uno a uno sea uno a uno? Justificar la conclusión.
21. Demostrar que T(x, y ) = (O, O) define un operador lineal sobre R2 pero T(x, y ) = (1, 1)
no lo hace.
22. Demostrar que si TRn + Rm es una transformación lineal, entonces To) = O; es decir,
T transforma el vector cerode Rn en el vector cero deRm.
23. Sea 1 la recta en el plano xy que pasa por el origen y forma un ángulo con el eje .x
positivo, donde O I8 < Z. Sea TB2 + R2 el operador lineal que refleja cada vector
respecto 1(figura 8).
Figura 8
a) Usar el método del ejemplo6 para encontrar la matriz estándar para T.
b) Encontrar la reflexión del vector x = (1, 5) respecto a la recta 1 que pasa por el
origen y forma un ángulo 8 = 30' con el eje x positivo.
X n es invertible si y sólo si el sistema lineal Ax = w tiene
exactamente una solución para todo vector w en Rn para el que el sistema es consistente.
24. Demostrar: Un matriz A n
5.1
ESPACIOS VECTORIALES REALES
En esta sección se generalizará aún más el concepto de vector. Se enunciará un
conjunto de axiomas que, si una clase de objetos hace que se cumplan, permitirá
denominar %ectores" a esos objetos. Los axiomas se elegirán abstrayendo las
propiedades más importantes de los vectores en Rn; como consecuencia, los
vectores en Rn harán que se cumplan de manera automática estos axiomas. Así, el
nuevo concepto de vector abarcará a los vectores anteriores y también a muchos
vectores nuevos. Estos vectores nuevos incluirán, entre otras cosas, varias clases
de matricesyfunciones.
El trabajo desarrollado en esta sección no es un
ejercicio inútil de matemáticas teóricas, ya que proporciona una herramienta
poderosa para extender la representación geométrica a una amplia variedad de
problemas matemáticos importantes en los que de otra forma no se contaría con
la intuición geométrica. Planteada en términos breves, laidea es ésta: Los
vectores en R2 y R3 se pueden representar geométricamente como flechas, lo cual
permite que la representación fisica o mental ayude a resolver problemas. Como
los axiomas que se usarán para crear los nuevos tipos de vectores se basarán en
propiedades de los vectores en R2 y R3, estos nuevos vectores poseeránmuchas de
las propiedades conocidas de los vectores en R2 y R3. Por consiguiente, cuando
se quiera resolver un problema en que aparezcan los nuevos tipos de vectores,
por ejemplo matrices o funciones, se podrá obtener una base para el problema
mediante una geométrica cómo sería el problemacrrespondiente en R 2 y R3.
25 7
256: / Espacios vectorides generales
AXIOMAS DE
ESPACIOS
VECTORIALES
Definición. Sea V un conjunto cualesquiera no vacío de objetos sobre el que
están definidas dos operaciones: la adición y la multiplicación por escalares
(números). Por adición se entiende una regla que asocia a cada par de objetos u
y v en I' un objeto u + v denominado suma de u y v; por muMplicación escalar
se entiende una regla que asocia a cada escalar k y cada objeto u en V un objeto
k u , denominada múltplo escalar de u por k. Si los objetos u, v, w en V y los
escalares k y 1 satisfacen los siguientes axiomas, entonces V se denomina
espacio vectorial, y sus objetos se denominan vectores.
1) Si u y v son objetosen V, entonces u -+ v está en V.
2) u +- v = v + u
3) u + ( v 4- w ) = ( u 4-v) + w
4) Existe un objeto O en V, denominado vector cero de V, tal que O + u = u + O
= u para todo u en V.
5) Para todo u en T/ cxiste un objeto "u en V, denominado negativo de u, tal
que u + (-u) = (-u) + u = O .
6) Si k es cualquier escalar y u es cualquier objeto en V, entonces ku está en V.
7) k(u + v ) = k u + k v
8)
(x + /)U = k M + ¡U
9) k ( h ) =- ( k / ) ( u )
10) l u = u
Dependiendode la aplicación,losescalarespuedensernúmeros reales o complejos. Los espacios vectoriales en que los escalares son números complejos se denominan espacios vectoriales complejos, y aquéllos donde los
escalares deben ser reales se denominan espacios vectoriales reales. En el capítulo
10 se estudiarán los espacios vectoriales complejos; hasta entonces, todos los escalares considerados serán números reales.
OBSERVACI~N.
El lector debe tener en mente que la definición de espacio vectorial no
especifica la naturaleza de los vectores ni las operaciones. Cualquier tipo de objeto
puede ser un vector, y es posible que las operaciones de ahción y multiplicación
escalar no guarden ninguna relación o semejanza con las operaciones vectoriales
estándar sobre R". El Único requisito es que se cumplan los 10 axiomas en la
definición de espacio vectorial. Algunos autores
usan las notaciones@y
en la adición vectorial y la multiplicación escalar para distinguir estas operaciones de la alción y la multiplicación de números reales; a pesar de ello, aquí
no se usará esta notación.
0
EJEMPLOS DE
ESPACIOS
VECTORIALES
Los siguientes ejemplos ilustran la variedad de espacios vectoriales posibles. En
cada ejemplo se especifica un conjunto novacío V y dos operaciones: la alción y
la multiplicación escalar; luego se comprobará que se cumplen los 10 axiomas de
espacio vectorial, con lo cual V se puede denominar, con las operaciones especificadas, espacio vectorial.
Ejemplo 1 El conjunto V = R" con las operaciones estándar de adición y multiplicación escalar, definido en la sección 4.1 es un espacio vectorial. Los axiomas 1 y
5.1 Espacios vectoriales reales / 259
6 se deducen de las definiciones de las operaciones estándar sobre R"; .los demás
axiomas se deducen del teorema 4.1.1. A
Los tres casos especiales más importantes de R" son R (los números reales),
R2 (los vectores en el plano) y R3 (los vectores en el espacio tridimensional).
Ejemplo 2 Demostrar que el conjunto V de todas las matrices 2 x 2 con elementos reales es un espacio vectorial si la ahción vectorial se define como la suma de
matrices y la multiplicación escalar vectorial se define como la multiplicación escalar matricial.
Solución. En este ejemplo resulta conveniente verificar los axiomas en el
siguiente orden: 1, 6, 2, 3 , 7 , 8, 9, 4, 5 y 10. Sea
Para probar el axioma 1, es necesario demostrar que u + v es un objeto en V; es
decir, debe demostrarse que u + v es una matriz 2 X 2. Pero este hecho se deduce
por la definición de ahción de matrices, ya que
De manera semejante, el axioma 6 se cumple porque para cualquier número real k
se tiene
de modo que ku es una matriz 2 x 2 y en, consecuencia, es un objeto en V.
El axioma 2 se deduce del teorema 1.4. ya
la,que
De manera semejante, el axioma 3 se deduce del inciso b) de ese teorema; y los
axiomas 7, 8 y 9 se deducen de los incisos h), j ) y f), respectivamente, de ese teorema.
Para probar el axioma 4 es necesario encontrar un objeto O en V tal que O +
todo u en V. Esto puede lograrse al definir a O como
u = u + O = u para
Con esta definición,
y de manera semejante u + O = u. Para probar el axioma 5 se debe demostrar que
cada objeto u en V tiene un negativo "u tal que u + (-u) = O y (-u) + u = O. Esto
se puede hacer definiendo el negativo de u como
Con esta definición
y de manera semejante (-u)
cálculo:
+
u = O.
Por último, el axioma 10 es un simple
Ejemplo 3 El ejemplo 2 es un caso especial de una clase más general de espacios
vectoriales. Los razonamientos de ese ejemplo se pueden adaptar para demostrar
que el conjunto Y de todas las matrices m X n con elementos reales, junto con las
operaciones de adición de matrices y multiplicación escalar, es un espacio
vectorial. La matriz cero m X n es el vector cero O, y si u es la matriz U m X n,
entonces la matriz -U es el negativo -u del vector u. Este espacio vectorial se
denotará por el símbolo M*,,. A
Ejemplo 4 Sea V el conjunto de las funciones con valores reales definidas sobre
toda la recta real (- m , m ) . Si f =Ax) y g = g(x) son dos de estas funciones y k es
cualquier número real, entonces la función suma f + g y el múltiplo escalar kf se
definen por
(f + g)(s) = J'(.Y)
+ g(x)
(kf)(x) = kj'(.x)
En otras palabras, el valor de la función f + g en x se obtiene al sumar entre sí los
valores de f y g en x (figura la). De manera semejante, el valor de kf en x es k
veces el valor de f en x (figura lb). En los ejercicios se pide al lector demostrar
que Y es un espacio vectorial con respecto a estas operaciones. Este espacio vectorial se denota por F(- M, m). Si f y g son vectores en este espacio, entonces afkmar que f = g equivale a decir queAx) = g(x) para toda x en el intervalo (- m, m).
El vector O en F( - m , M) es la función constante que es idénticamente cero
para todos los valores de x. La gráfka de esta función es la recta que coincide con
el eje x. El negativo de un vector f es la función -f = -Ax). Geométricamente, la
gráfka de -f es la reflexión de la gráfka de f con respecto al eje x (figura IC). A
5.1 Espacios vectoriales reales 1 261
Figura 1
hi
al
Cl
En el ejemplo precedente, la atención se centró en el intervaEn caso de que la atención se hubiera restringido a algún intervalo
cerrado [a, b ] o en algún intervalo abierto (a,b), las funciones definidas en estos
intervalos con las operaciones establecidas en el ejemplo también hubieran producido espacios vectoriales. Estos espacios vectoriales se denotan por F [a,b ] y F(a,
b), respectivamente.
OBSERVACI~N.
lo
(-m, m).
Ejemplo 5 Sea V = R2, con las operaciones de adición y multiplicación escalar de-
finidas como sigue: Si u = (u1, u2) y v = (vl, v2), entonces se define
u+v=(u, +u,,u,+u,)
y si k es cualquier número real, entonces se define
ku
= ( k u , , O)
Por ejemplo, si u = (2, 4) y v = ( - 3 , 5), y k = 7, entonces
u+v=(2+(-3),4+5)=(-1,9)
ku = 7u = ( 7 . 2 , O) = (14, O)
La operación de adición es la operación de adición estándar sobre R2, pero la
multiplicación escalar no es la multiplicación escalar estándar. En los ejercicios se
pide al lector demostrar que se cumplen los nueve primeros axiomas de espacio
vectorial; sin embargo, existen valores de u para los cuales no se cumple el axioma
10. Por ejemplo, si u = (u,, u2) es tal que u2 # O, entonces
l u = l ( u , , u2) = (1 . u , , O)
= (u,,
O) # u
Por tanto, V no es un espacio vectorial con las operaciones establecidas. A
Ejemplo 6 Sea Vcualquier plano qui: pasa por el ongen en R'. Se demostrara que
los puntos en V constituyen u n espacio kectorial bajo las Operaciones estandar de
Por el ejemplo I, se sabe que
adxión y multiplicación escalar para veclores en
I?'.
262 / Espacios vectoriales genevales
R3 mismo es un espacio vectorial bajo estas operaciones. Así, los axiomas 2, 3, 7,
8, 9 y 10 se cumplen para todos los puntos en R3 y en consecuencia, para todos
los puntos en el plano V. Por consiguiente, basta demostrar que se cumplen los
axiomas 1,4, 5 y 6.
Como el plano Vpasa por el origen, tiene una ecuación de laforma
ax
+ by + cz = O
(1)
(Teorema 3.5.1). Por tanto, si u = (ul, u2, u3)y v = (vl, v2, v3)
son puntos en V,
entonces aul + bu2 + cu3 = O y a v l + bv2 + cv3 = O. Sumando estas ecuaciones se
obtiene
+ U ] ) + b(u, + u 2 ) + c(u3+ u 3 )= o
a(u*
Esta igualdad establece que las coordenadas del punto
u +v
= (U]
+ u1, u2 + u2, u3 + u 3 )
satisfacen (1); así, u + v está en el plano V. Esto demuestra que secumpleel
axioma 1. Las verificaciones de los axiomas 4 y 6 se dejan como ejercicios; sin
embargo, se demostrará el axioma 5. AI multiplicar aul + bu2 + cu3 = O por - 1 se
obtiene
t
Así,
"u =
( -ul, -u2, -u3) está en I.'. Esto establece el axioma 5. A
Ejemplo 7 Sea V que consta de un solo objeto, elcual se denota por O, y se define
o+o=o
kO = O
para todos los escalares k. Es fácil comprobar que se cumplen todos los axiomas de
espacio vectorial. Este espacio se denomina espacio vectorial cero. A
ALGUNAS
PROPIEDADES
DE LOS
VECTORES
A medida que se avance, se agregarán más ejemplosde espacios vectoriales a la
lista. Esta sección concluye con un teorema que da una lista útil de propiedades
vectoriales.
Teorema 5.1.1. Sean V un espacio vectorial, u un vector en V y k un escalar;
entonces:
a ) Ou = O
b) kO = O
c) (-I)u=
"u
d) If ku = O, entonces k = O
o
u = O.
Se demostrarán los incisos a) y c), y las demostraciones de los demás incisos se
dejan como ejercicios.
-
5.I Espacios vectoriales reales / 263
Demostración de a). Se puede escribir
ou + ou
= (O
=
+ O)u
[Axioma 81
ou
[ Propiedad del número O
1
Por el axioma 5, el vector Ou tiene un negativo: -0u. Al sumar este negativo a
ambos miembros de la última e>rpresiónse obtiene
O
ou + [Ou
-t (-Ou)] = ou
+ (-OU)
[Axioma 31
[Axloma 51
ou+o=o
ou = o
[Axloma 41
Demostración de c). Para probar (- 1)u = “u, es necesario demostrar que u +
(- I)u = O . Para ver esto, obsérvese que
u+(-l)u= lu+(-l)u
=
=
(1 + ( - 1))u
Ou
[Axloma 101
[Axloma 81
(Propiedad de los números]
=o 0
EJERCICIOS DE LA SECCIóN 5.1
En los ejercicios del 1 al 13 se da un conjunto de objetos, junto con operaciones de adición
y multiplicación escalar. Determinar cuáles conjuntos son espacios vectoriales bajo las operaciones dadas. Para aquellos que no sean espacios vectoriales, enumerar los axiomas que
no se cumplen.
1. El conjunto de todas las temas de números reales (x, y , z) con las operaciones
(x,y, z ) + (x’,y ’ , z ’ ) = (x + x’,y
+ y’, i + 2 ’ )
k(x, y , 2) = (kx, ,Y, z )
y
2. El conjunto de todas las temas de números reales (x, y , z) con las operaciones
(x,y, z) + (x‘,y ‘ , z ‘ ) = (x
+ x’,y + y ‘ ,2 + z ‘ )
y
k(x, >, z ) = (O,
o, O)
3. El conjunto de todas las parejas de números reales (x, y) con las operaciones
(x,Y ) f
(x’, Y ’ ) = (x
+ x‘, y +u‘)
y
k(x, y) = W x , 2ky)
4. El conjunto de todos los números reales x con las operaciones estándar de adición y
multiplicación.
5. El conjunto de todas a
ls parejas de números reales de la forma (x, O) con las opera-
ciones estándar sobre R2.
[ Inciso u)]
261 / Espacios vectoriales generales
I. El conjunto de todas las parejas denúmeros reales de ia forma (x, y ) , donde x 2 O, con
las operaciones estándar sobreR2.
7. El conjunto de todas las n-adas de números reales de la
forma ( x , x ,.
. .
, x ) con las
operaciones estándar sobreR".
8. El conjunto de todas las parejas denúmeros reales (x,y ) con las operaciones
(x, y )
+ (xf, y ' ) = (x + x' + 1, y
9. El conjunto de todas las matrices 2
X
f y'
+ 1)
y
k ( x , y ) = (kx, ky)
2 de la forma
[::I
con la adición y la multiplicación escalar de matrices
1o. El conjunto de todas lasmatrices 2
X
2 de la forma
con la adici6n de matrices y la multiplicación escalar.
11. El conjunto de todas las t i c i o n e s y c o n valores reales definidas en cualquier punto de
la recta real y tales quefil) = O, con las operaciones definidas enel ejemplo 4.
12. El conjunto de todas las matnces2
X
2 de la forma
con la adicinn y la multiplicación escalar de matrices
13. El conjunto cuyo Único elemento es la Luna. Las operaciones son Luna
y k(Luna) = Luna, donde k es un número real.
+ Luna = Luna
14. Demostrar que una recta que pasa por el origen en R3 es un espacio vectorial bajo las
operaciones estándar sobre R".
15. Demostrar que el conjunto de todos los números reales positivos con l a s operaciones
x+y=xy
y
h=xk
es un espacio vectorial.
16. Escribir los detalles quefaltan en el ejemplo 4
17. Escribir los detalles que faltan en el ejemplo 6
IS. Demostrar el inciso b ) del teorema 5.1. l .
19. Demostrar el inciso 6)del teorema 5.1.1
Subespacios
/’
265
20. Demostrar que un espacio vectorial no puede tener más de un vector cero
21. Demostrar que un vector tiene exactamente un negativo.
22. Demostrar que los nueve primeros axiomas de espacio vectorial se cumplen si V = X’
tiene la adición y la multiplicación escalar definidas en el ejemplo 5.
5.2 SUBESPACIOS
Es posible que un espacio vectorial esté contenido
en un espacio vectorial más
grande. Por ejemplo, en la sección precedente se demostró que los plcnos que
pasan por el origen son espacios vectoriales contenidos en el espacio vectorial
más grande R3. En esta sección se estudiará con más detalle esta importante idea.
DE
SUBESPACIO
Definici6n.Un subconjunto W de un espacio vectorial V se denomina subespacio de V si W es un espacio vectorial bajo la adición y la multiplicación escalar
definidas sobre V.
En términos generales, para demostrar que un conjunto W con la adición y la
multiplicación escalar forma un espaciovectorial es necesario verificar los 10
axiomas de espacio vectorial. Sin embargo, si W es parte de un conjunto más
grande V del que se sabe es un espacio vectorial, entonces no es necesario verificar
ciertos axiomas para W porque son “heredadosll de V. Por ejemplo, no es necesario
comprobar que u + v = v + u (axioma 2) para W , porque esta relación se cumple
para todos los vectores en C’ y, en consecuencia, para todos los vectores en W.
Otros axiomas heredados por W de V son los axiomas 3, 7, 8, 9 y 10. Así, para
demostrar que un conjunto W es un subespacio de un espacio vectorial V, basta
comprobar los axiomas 1, 4, 5 y 6. El siguiente teorema muestra que inclusive se
puede prescindir de los axiomas 4 y 5.
Teorema 5.2.1. Si W es un conjunto formado por uno o mús vectores de un
espacio vectorial V, entonces W es un subespacio de V si y sólo si se cumplen
las siguientes condiciones.
a ) Si u y v son vectores en W, entonces u + v está en W.
h ) Si k es cualquier escalar y u es cualquier vector en W, entonces ku está en
W.
Demostración. Si W es un subespaciode V, entonces se cumplen todoslos
axiomas de espacio vectorial; en particular, se cumplen los axiomas 1 y 6. Peto
éstas son precisamentea
ls condiciones a) y 6).
266 / Espacios vectoriales generales
Recíprocamente, supóngase que se cumplen las condciones a ) y b). Como
estas conlciones son los axiomas 1 y 6 de espacio vectorial, basta demostrar que
W satisface los ocho axiomas restantes. Los vectores de W cumplen automáticamente los axiomas 2, 3 , 7, S, 9 y 10, ya que estos axiomas se cumplen para todos
los vectores en V. En consecuencia, para completar la demostración, basta verificar que los axiomas 4 y 5 se cumplen para vectores en W .
Sea u cualquier vector en W . Por la condición b), ku está en W para
cualquier escalar k. Haciendo k = O, por el teorema 5.1.1 se concluye que Ou = O
está en W, y haciendo k = - 1 se concluye que (- l)u = --.uestá en W. 0
Se dice que un conjunto W formado por uno o más vectores de
un espacio vectorial Ves cerrado bajo La adición si se cumple la condición a ) del
teorema 5.2.1, y cerrado bajo la multiplicación escalar si se cumple la condición
b). Así, el teorema 5.1.1 establece que W es un subespacio de V si y sólo si W es
cerrado bajo la adicióny cerrado bajo la multiplicación escalar.
OBSERVACI~N.
EJEMPLOS DE
SUBESPACIOS
A
Ejemplo 1 En el ejemplo 6 de la sección 5.1 se comprobaron los 10 axiomas de
espacio vectorial para demostrar que los puntos en un p l a o que pasa por el origen
de R3 forman un subespacio de R3. En vista del teorema 5.2.1 se puede ver que
muchodel trabajo efectuado fue innecesario; hubiera bastado verificar que el
plano es cerrado bajo la adción y bajo la multiplicación escalar (axiomas 1 y 6).
En la sección 5.1 se comprobaron algebraicamente estos dos axiomas; sin embargo, también se pueden demostrar geométricamente como sigue: Sea W cualquier plano que pasa por el origen, y sean u y v vectores cualesquiera en W. Entonces u + v debe estar en W porque es la diagonal del paralelogramo determinado
por u y v (figura l), y ku debe estar en W para cualquier escalar k porque ku est5
sobre una recta que pasa porw Así, W es cerrado bajo la adición y la multiplicación escalar, de modo que es un subespacio de R3. A
Ejemplo 2 Demostrar que una recta que pasa por el origen de R3 es un subespacio
de R3.
Solución. Sea W una recta que pasa por el origen de R3. Geométricamente es
evidente que la suma de dos vectores sobre esta recta también está sobre la recta, y
que un múltiplo escalar de un vector sobre la recta también está sobre la recta
(figura 2). Así, W es cerrado bajo la adición y la multiplicación escalar, de modo
que es un subespacio de R3. En los ejercicios se pide al lector demostrar algebraicamente este resultado usando las ecuaciones paramétricas de la recta.
Figura 2
W es cerrado bajo la multiplicación.
I I W es cerrado bajo la multiplicación escalar.
5.2 Subespacios / 267
Ejemplo 3 Sea W el conjunto de los puntos (x, y ) en R2 tales que x 2 0 Y Y 2 o.
Estos son los puntos del primer cuadrante. El conjunto W no es un subespacio de
R2, ya que no es cerrado bajo la multiplicación escalar. Por ejemplo, v = (1, 1) está
enW,perosunegativo(-l)v=-v=(-l,-l)noestáenW(figura3).
A
Todo espacio vectorial V diferente de cero tiene por l o menos dos subespacios: Ves un subespacio, y el conjunto {O} que consta sólo del vector cero en V
es uil subespacio denominado subespacio cero. Combinando esto con los ejemplos
1 y 2 se obtiene la siguiente lista de subespacios deR2 y R3.
Subespacios de &
Subespacios de R2
{O}
0
0
Rectas que pasan por el origen
R2
(0)
Rectas que pasan por el origen
Planos que pasan por el origen
R3
Después se demostrará que estos son los únicos subespacios de R2 y R3.
Ejemplo 4 Por el teorema 1.7.2, la suma de dos matrices simétricas es una matriz
simétrica, y un múltiplo escalar de una matriz simétrica es simétrico. Así, el
conjunto de matrices simétricas n x n es un subespacio del espacio vectorial M,,
de a
ls matrices n X n. De manera semejante, el conjunto de las matrices triangulares superiores n X n, el conjunto de las matrices triangulares inferiores n x n y
el conjunto de las matrices diagonales n X n son subespacios de M,,, ya que cada
uno de estos conjuntos es cerrado bajo la adición y la multiplicación escalar. A
Ejemplo 5 Sea n un entero positivo y sea W que consta de todas las funciones que
pueden expresarse en la forma
p(x) = a0
+ a , x + . . + a,x"
'
(1)
donde ao, . . . , a, son números reales. Así, W consta de la función cero junto con
todos los polinomios reales de grado menor o igual que n. El conjunto W es un
subespacio del espacio vectorial de todas las funciones con valores reales que se
analizó en el ejemplo 4 de la sección precedente. Para ver esto, sean p y q los
polinomios
p(x) =a,
+ a,x + . . . + a,x"
Y
q(x) =bo + b,x + . . . + b,x"
Entonces
(p
+ q)(x) = p ( x ) + q(x) = (ao+ bo)+ ( a l + b , ) x + . . . + (a, + b,)x"
Y
(kp)(x) = kp(x) = (ka,)
+ ( k a , ) x+ . . + (ka,)x"
'
268 / Espacios vectoriales generales
Estas funciones son de la forma indcada en (l), de modo que p + q y kp están en
W. El espacio vectorial W de este ejemplo se denotará por el símbolo P,. A
Ejemplo 6 (Para quienes ya estudiaron Cálculo). Recuérdese que si f y g son
funciones continuas en el intervalo (- m , m) y k es una constante, entonces f
+ g y kf también son continuas. Así, ías funciones continuas sobre el intervalo
(- m , m) forman un subespaciode F(- m , m), ya que son cerradas bajo la
adición y la multiplicación escalar. Este subespacio se denota por C(- 03, m).
De manera semejante, si f y g son funciones derivables, entonces también f +
g y hf sonderivables. Así, lasfunciones con primerasderivadascontinuas
sobre (- m ,m ) formanunsubespaciode
F(- m ,m ) . Estesubespaciose
denota por C1(- m , m), donde el supraíndce 1 se usa para recalcar la primera
derivada. Sin embargo, un teorema del Cálculo es que toda función derivable es
continua, de modo que C'( - 03,m) es en realidad un subespacio de C(- m , m).
Continuando con lo anterior, para todo entero positivo m a
ls funciones con
m-ésimas derivadas continuas sobre (- m , m) forman un subespacio de C'( - CQ,
m), así como también las fúnciones que tienen derivadas continuas de todos los
órdenes.Elsubespaciodelasfuncionescon
m-ésimas derivadascontinuas
sobre (- m , m) se denota por P(m , m), y el subespacio de las funciones que
tienen derivadas continuas de todos los órdenes se denota por Cm(- m, m>.
Finalmente, un teorema del Cálculo es que los polinomios tienen derivadas
continuas de todos los órdenes, de modo que P, es un subespacio de C m(- m. m).
La jerarquía de los subespacios analizados en este ejemplo se representa en la
figura4. A
En elejemploprecedente,seatendióalintervalo
(- m , m).
En caso de haber atendido al intervalo cerrado [a,61, entonces los subespacios
correspondientes a los espacios vectoriales definidos en el ejemplo se hubieran denotado por C [ a , b], Cm [ a , b] y C[a,b ] . De manera semejante, sobre un intervalo abierto (a, b), esos subespacios se hubieran denotado por C(a, b), ?(u,
b) Y c m
(a,b).
OBSERVACI~N.
5.2 Subespacios / 269
ESPACIOS
SOLUCIóN DE
SISTEMAS
HOMOGÉNEOS
Si Ax = b es un sistema de ecuaciones lineales, entonces todo vector x que satisface esta ecuación se denomina vector solucidn del sistema. El siguente teorema
muestra que los
vectores solución de un sistema lineal homogéneo forman un
espacio vectorial. que se denomina espacio solución del sistema.
es un sistema lineal homogéneode m ecuaciones con
n incógnitas, entonces el conjunto de vectores solución es un subespacio de R".
I
I
Demostración. Sea W el conjunto de vectores solución. En W existe por 10
menos un vector, a saber, O . Para probar que W es cerrado bajo la adición y la
multiplicación escalar, es necesario demostrar que si x y x' son vectores solución
cualesquiera y k es cualquier escalar, entonces x + x' y b también son vectores
solución. Pero si x y x' son vectores solución, entonces
A x = O y Ax'=O
a partir de lo cual se deduce que
A(x+x')=Ax+Ax'=O+O=O
Y
A ( k x ) = kAx
= kO = O
lo que demuestra que x + x' y kg son vectores solución. 0
Ejemplo 7 Considerar los sistemas lineales
a)
c)
[i -% j[:l-[B1 [
[-i -: -:][!]=[:]
b)
- 31
-2
- 27
4
d ) [O0 O0 O]
0
0 0 0
Cada uno de estos sistemas contiene tres incógnitas, de modo que las soluciones
son subespacios de R3. Geométricamente, esto sigmfka que cada espacio solución
debe ser UM recta que pasa por el origen, un plano que pasa por el origen, sólo el
origen o todo R3. A continuación se comprobará que así es (se deja para el lector
la resolución de los sistemas).
Solución.
a) Las soluciones son
x = 2 s - 3 4 y=s,
a partir de lo cual se concluye que
z=t
270 / Espacios vectoriales generales
x = ~ Y - ~ Oz ~ - 2 y + 3 ~ 0
Esta es la ecuación del plano que pasa por el origen con n = (1, -2,
vector normal.
b) Las soluciones son
x = -5t,
y = -t,
3) como
z=t
que son las ecuaciones paramétricas de la recta que pasa por el origen y es
paralela al vector v = (-5, - 1, 1).
c) La solución es x = O, y = O, z = O, de modo que el espacio solución es sólo el
origen, es decir, { O ) .
d) Las solucionesson
x = r , y = s ,z = t
donde r , S y t tienen valores cualesquiera, de modo que el espacio solución es
todo R3. A
COMBINACIONESLINEALES
DE VECTORES
Enla sección 1.3 se introdujo elconcepto de combinación lineal de vectores
columna. La siguiente definición amplía esteconcepto a vectores más generales.
Definición. Un vector w se denomina combinacibn lineal de los vectores vl,
v2, . . . , v, si se puede expresar en la forma
w = k , ~+, kzvr + .
'
+ k,.v,
donde k,, k,, . . . , k,son escalares.
Si r = 1, entonces la ecuación dela definición precedentese
reduce a w = klvl; es decir, w es una combinación lineal de un solo vector v, si es
un múltiplo escalar de v,.
OBSERVACI~N.
Ejemplo 8 Todo vector v = (a, 6, c ) en R3 se puede expresar como una combinación lineal de los vectores estándar básicos
i=(l,O,O),
j=(O,
1,0),
k=(O.O,l)
Ya que
v
= (U,
h, c ) = ~ ( l O,
, O)
+ h(0, 1, O) + c(0, O,
1) = ai
+ bj + ck
A
Ejemplo 9 Considerar los vectores u = (1, 2, - 1) y v = ( 6 , 4, 2) en R3. Demostrar
que w = (9, 2, 7) es una combinación lineal de u y v, y que w'= ( 4, -1, 8) no es
una combinación lineal de u y v.
Solución. Para que w sea una combinación lineal de u y v, deben existir escala-
res k , y k2 tales que w
= k,u
+ k2v; es decir,
5.2 Subespacios / 271
(9, 2 , 7 ) = kI(1, 2, - 1) + k2(6, 4 , 2 )
o bien,
(9, 2 , 7 ) = ( k , + 6k2, 2k1 44k,, - k ,
+ 2k2)
Igualando las componentes correspondientes se obtiene
k,
2k,
-k,
La solución del sistema es k ,
=
+ 6k2 = 9
+ 4k, = 2
+ 2k, = 7
-3, k, = 2, de modo que
w=-~u+~v
De manera semejante, para que w' sea una combinación lineal de u y v,
deben existir escalares k , y k, tales que w' = klu + k,v; es decir,
(4, - 1 , 8 ) = k , ( I , 2 , - l ) + k 2 ( 6 , 4 , 2 )
O
(4, - 1, 8) = ( k ,
+ 6k2,
2 k ,+ 4k2,
-
k, + 2k2)
Igualando las componentes correspondientes se obtiene
k , + 6k2 =
2 k , + 4k2 =
-k+
t 2k,
=
4
-
1
8
Este sistema de ecuaciones es inconsistente (comprobar), de modo que no existen
los escalares k, y k,. En consecuencia, w' no es una combinación lineal de u y v. A
ESPACIO
GENERADO
(Lw
Si vl, v,, . . . , v, son vectores en un espacio vectorial V, entonces en general algunos vectores en V pueden ser combinaciones lineales de vl, v,, . . . , v, y otros
no. El siguiente teorema muestra que si se construye un conjunto W que consta de
todos los vectores que es posible expresar como combinaciones lineales de vl,
Y,, . . . , v,, entonces W forma un subespacio de V.
Teorema 5.2.3. Si vl, v,, . . . , v, son vectores en un espacio vectorial V, entonces:
a ) El conjunto W de todas las combinaciones lineales de v l , v,, . . . , v, es un
subespacio de V.
6 ) W es el menor subespacio de Y que contiene a v,, v,, . . . , vr, en el sentido
de que cualquier otro subespacio de V que contenga a v,, v,, . . . , v, debe
contener a W.
Demostración de a).Para demostrar que W es un subespacio de V, es necesario
probar que es cerrado bajo la adición y la multiplicación escalar. En W existe por
2 72
Espacios vecforiales generales
lo menos un vector, a saber, O, ya que O
vectores en W, entonces
= Ovl
+ Ov2 + . .
.
, + Ov,. Si u y v son
Y
donde el. c2,. . . , c, k,, k2, . . . , k, son escalares. Por consiguiente.
u
+ v = ( c , + k , ) v , + ( c 2 + k , )Ir2 +
'
' '
+ (cr+ kJv,.
y, para cualquier escalar k.
Así, u + v y ku son combinaciones lineales de v l , v2, . . . , v,, y, en consecuencia,
están en W. Por tanto, W es cerrado bajo la adición y la multiplicación escalar.
Demostración de b). Cada vector v, es una combinación lineal de v , , v2, . . . , v,,
ya que es posible escribir
v, = ov,
+ ov, f . . + Iv, +
'
.
'
+ ov,.
Por consiguiente, en el subespacio W están todos y cada uno de los vectores
v l . v2, . . . , v,. Sea W cualquier otro subespacio que contiene a v l , v2, . . . , v,.
COIIAO
W' es cerrado bajo la adición y la multiplicación escalar, debe contener
todas las combinaciones lineales de v I , v2, . . , v,. Así, u." contiene a cada vector
de W. 0
,
Se hace la siguiente definición.
Definición. Si S = { v l , v2, . . . , vr} es un conjunto de vectores en un espacio
vectorial Y, entonces el subespacio W de Y que consta de todas las combinaciones lineales de los vectores en S se denomina espacio generado por v l ,
v2, . . . , v,, y se dice que los vectores v l , v2, . . . , v, generan a W. Para indicar
que W es el espacio generado por los vectores del conjunto S = { v l , v2, . . . , v,}
se escribe
I
Ejemplo 10
W = lin (S) o bien, W = lin { v l , v z , .. . ,vr1
I
Si v 1 y v2. son vectores no colineales en R3 con puntos iniciales
en el origen, entonces lln {v v2} , que consta de las combinaciones lineales
1.'
+
es el plano determmado por v1 y v (figura 5a). De manera semejante, si v es un vector diferente de cero en R 2 o R 3 , entonces lin {v}, que es
el conjunto de todos los múltiplos escalares k v , es la recta determinada por v
(figura 56). A
kv, kv,,
5.2 Subespacios / 273
Ejemplo 11 Los polinomios 1, x, x2,
. . . , x" generan el espacio Pn definido en
el ejemplo 5, ya que todo polinomio p en Pn se puede escribir como
p = a, + a,x + .
'
'
+ a,x"
que es una combinación lineal de 1, x, x,, . . . , x " . Lo anterior se puede denotar
Por
P, = Generado { 1, x,x*, . . . , x"} A
I
Ejemplo 12 Determinar si v1 = (1, 1,2), v, = (1, O, 1) y v3 = (2, 1, 3) generan el
espacio vectorial R3.
Solución. Es necesario determinar si un vector arbitrario b = ( b l , b,, b3) en R3 se
puede expresar como una combinación lineal
de los vectores vl, v2 y v3. Expresando esta ecuación en términos de las componentes se obtiene
2 74
Espacios vectoriales generules
El problema se reduce entonces a determinar si este sistema es consistente
para todos los valores de b,, b, y b,. Por los incisos a ) y e ) del teorema 4.3.4, este
sistema es consistente para todo b,, b, y 6, si y sólo si la matriz de coeficientes
es invertible. Perodet(A) = O (comprobar), de modo que A no es invertible; en
consecuencia, v,, v2 y v3 no generan R3. A
Los conjuntos generadores no son únicos. Por ejemplo,dosvectores
colineales cualesquiera que estén en el plano que se muestra en la figura 5 generan
el mismo plano, y cualquier vector diferente de cerc que esté sobre la recta de esa
figura genera la misma recta. La demostración del siguiente teorema útil se deja
como ejercicio.
Teorema 5.2.4.Si S = {vl, v2, . . . . v,.} y S = {wl, w2, . . . , w, } son dos
conjuntos de vectores en un espacio vectorial V, entonces
Generado { v ,, Y*. . , . , v,}
I
=
,
Generado { w ,w 2 , . . . ,wk}
si y s61o s i iodo vector en S es una combinación lineal de los vectores en S y ,
veciprocamente, todo vector en S es una combinación lineal de los vectores en
S.
EJERCICIOS DE LA SECCIÓN 5.2
1. Usar el teorema 5.2.1 para determinar cuales de los siguientes conjuntos son subespacios de R 3 .
a) Todos los vectores de la forma (a,O, O).
b) Todos los vectores de la forma ( a , 1, 1).
c ) Todos los vectores de l a fonna (a,b, c ) , donde b = a + c.
d) Todos los vectorzs de la fonna (a,b, e), donde h = a + c + 1
2. Usar el teorema 5.2.1 para determinar cuáles de los siguientes conjuntos son subespacios
a) Todas las matrices 2 X 2 con elementos enteros.
b) Todas las matrices
c)
dondea+b+c+d=O.
Todas las matnces A 2 X 2 tales que det(il) = O
3. Usar el teorema 5.2.1 para determinar cuáles de los siguientes conjuntos son subespacios de P,.
5.2 Subespacios / 275
a) Todos los polinomios a. + alx + u$ + a+3 para los que a. = O.
b) Los polinomios a0 + alx+ a$ + a,$ para los quea. + al + a2 + a3= o.
c) LOS polinomios a. + alx + U.$ + a3x3para los que ao,a , ,a2 y a3 son enteros.
d) Los polinomios de la forma a,,+ a,x, donde a. y a, son números reales.
4. Usar el teorema 5.2.1 para determinar cuáles de los siguientes conjuntos son subespacios del espacioF( - 03,m ) .
a) Todas lasftales queflx) O paratoda x.
b) Todas lasftalesquefl0) = O.
Todas
c)
lasftales quef(0) = 2.
d) Todas las funciones
constantes.
e) Todas lasfde la forma k , + k, sen x, donde k , y k, son números reales.
5. Usar el teorema 5.2.1 para determinar cuáles de los siguientes conjuntos son subespa-
cios de M,,,,.
a) Las matrices A n
b) Las matrices A n
c) Las matricesA n
X
X
X
k
n tales que tr A ) = O.
n tales que A = -A.
n tales que el sistema linealAx = O sólo tiene la solución tnvial.
6. Determinar si el espacio solución del sistema Ax = O es una recta que pasa por
el
origen, un plano que pasa por el origen o sólo es el origen. Si es un plano, encontrar su
ecuación; si es una recta, encontrar sus ecuaciones paramétricas.
.)A=[-:
-4
d)A=[!
i]
- 11
2
:]
b)A=[-3 1
-5
-6
"1
-2
-2
e)A=[i
c ) , 4 = [ 21 52 3 1
1 0 8
-6
f, A=[:
]!l
18
-3
i]
7. ¿Cuáles de los siguientes vectores son combinacioneslineales de u = (O, -2, 2) y v =
(1,3, -l)?
a) (2,2,2).
b) (3, 1,5).
c) (O, 4, 5).
d) (0,
o, O).
8. Expresar cada uno delos siguientes vectores como combinacioneslineales de u = (2, 1,
4), v = (1, -1,3) y w = (3,2, 5).
a) (-9, -7, -15).
b) (6, 11,6).
c) (0, o, O).
d) (7,8, 9).
9. Expresar cada uno de lossiguientes polinomios como una combinación lineal de p, = 2
+x+42,p2=1 -x+32yp3=3+2x+52.
a) -9 - 7x - 152.
b)6+11x+62.
c) o.
d) 7 + 8x+ 9 2 .
10. ¿Cuáles de las siguientes matrices son combinacioneslineales de
11. En cada inciso, determinar si los vectores dados generanR3
a) vl = (2, 2, 21, v2 = (O, O, 31, v3 = (O, 1, 1)
13. Ikterminar si los slguientes polinomios generan P,.
=
I
p,
=
5 ~ -t
x 4*'.
--
x
pz = 3 + x.
ps = - 2
2.u Jr 2 2
+3 2 .
p,
"
v,
= (2, I , O, 3), v, = (3, - 1, 5, 2) y vj = ( - 1, O, 2, 1). LCuáIes de los siguientes
vectores están en lin {v,, v2, v3)?
a) ( 2 , 3 , - 7 , 3 ) .
h) (a, O, o. o)
C) ( I , I . I. 1).
d) -4,6, -13,4).
14. Sean
IS. hcontrar la ecuación del plano generado por los vectores u = (-- 1 , 1, I ) y
v = (3,4.4).
16. Encontrar las ecuaciones paramétricas de la recta generadapor el vector u = ( 3 , -2, 5).
17. Demostrar que los vectores solución de un sistema no homogéneo consistente de m
ccuaciones linealcs con n incógnitas no forma un subespacio de R".
18. Demostrar el teorema 5.2.4
19. Aplicar el teorema 5 2.4 para demostrar que
v,=(l.h.4),
v , = ( 2 . 4 , -1).
v3=(-l,2,5)
Y
W!
=(I,
-2, -5),
WI =
(O. 8, 9)
general el msmo subespacio de R'.
20. llna recta L que pasa por el origen en R3 se puederepresentar por ecuaciones
paramétricas de la forma x = at,y = ht y z = ct. Usar estas ecuaciones para demostrar
que L es un subespacio de R3; es decir, si v, = (x,, y , , z,) y v2 = (x2,y,, z2) son puntos
y v, + v2 también son puntos en L.
en L y k es cualquier número real. entonces
kv,
21. (Para quienes ya estudiaron Cdkulo). Demostrar que los siguientesconjuntos
funciones son subespacios de F( - m , m).
a) Las funciones que son continuas en todas partes.
b) Las funciones que son derivables en todas partes.
c ) Idas funciones que son derivables en todas partes y que satisfacen f
de
+ 2f = O.
22. (Pura quienes y a estudiaron Cúlculo). Demostrar que el conjunto de funciones continuas f =./(x) sobre [a,bj tales que
f f
(x) dx = O
es un subespacio de C [ a ,h ]
5.3 Independencia lineal / 277
5.3 INDEPENDENCIA LINEAL
En la secnbn precedente se aprendió que un conjunto de vectores S = { v ~v2,
, ...,
vr} genera un espacio vectorial
I' dado si todo vector en V se puede expresar
como una combinación lineal de los vectores en S. En general, puede haber más
deuna forma de expresar un vector en V conlo una combinaciónlineal de
vectores en un conjunto generador. En esta sección se estudiarán condiciones en
las que cada vector en V se puede expresar de manera única como una combinación linealde los vectoresgeneradores. Los conjuntosgeneradorescon
esta
propiedad son fundamentales enel estudio de los espacios vectoriales.
Definición. Si S = {v v
1.' 2'
ces la ecuación vectond
DEFINICI~NDE
INDEPENDENCIA
LINEAL
, vr>es un conjunto no vacío de vectores, enton'
'
'
k,v, + k2v2 + . . . + k,~, = O
tiene por lo menos una solución, a saber,
k,=O,
k:=O,
...,
k,=O
Si esta es la única solución, entonces S se denomina conjunto linealmente independiente. Si existen otras soluciones, entonces S se denomina conjunto linealmente dependiente.
Ejemplo 1 Si v1 = (2, -1, O, 3), v2 = (1, 2, 5, - 1 ) y v3 = (7, - 1, 5 , 8), entonces
el conjunto de vectores S = v , , v2, v3 es linealmente dependiente, ya que 3vl +
v2 - v3 = O . A
Ejemplo 2 Los polinomios
p,
=
1 -x,
p2 = 5
+- 3.x
"
22,
p3 = 1 + 3 x - x2
y
forman un conjunto linealmente dependiente
en P2, ya que 3p,
-
pz + 2p,
= O.
A
Ejemplo 3 Considerar los vectores i = (1, O, O), j = (O, 1, O) y k = (O, O, 1) en R3.
En términos de las componentes, la ecuación vectorial
k,i + k2j + k,k
=O
se convierte en
k,( 1,
o. O) + k,rO,
l . O)
-L-
J"(0,
o, 1) = (O,
o equivalentemente,
(itl,
-
. . ..,
.
IC,>
P,)
~= (0;
o *
0)
O,
0)
278 / Espacios vectoriales generales
Lo anterior indica que k, = O, k2 = O y k3 = O, de modo que el conjunto S = {i, j, k}
es linealmente independiente. Sepuede usar un razonamiento semejante para
demostrar que los vectores
e , = ( O , 1,0, . . . , O),
e,=(1,0,0,. ..,O),
. . . , e , = ( 0 , 0 , 0 , . . , , 1)
forman un conjunto linealmente independiente en R". A
Ejemplo 4 Determinar si los vectores
forman un conjunto linealmente dependiente o un conjunto linealmente independiente.
Solución. En términos de las componentes, la ecuación vectorial
k,v,
+ k2v, + k 3 v , = O
se convierte en
kI(1, - 2, 3 ) + k2(5, 6, - 1 )
+ k3(3, 2, 1) = (O, O, O)
o equivalentemente,
( k , + 5k,
+ 3k3,
-
2k,
+ 6k, + 2 k 3 ,3kl - k2 + k 3 ) = (O, O, O)
Igualando las componentes correspon&entes se obtiene
k, + 5k,
+
+ 3k,
=O
+
-2k,
6k2 2k3 = O
3k, - k , + k3 = O
Así, v,, v2 y v3 forman un conjunto linealmente dependiente si este sistema tiene
una solución no trivial, o forman un conjunto linealmente independiente sólo si el
sistema tiene la solución trivial. Resolviendo el sistema se obtiene
k -
-1n t ,
k2 -
-'
zt,
k,=t
Por tanto; el sistema tiene soluciones no triviales y v l , v2 y v3 forman un conjunto
linealmente dependiente. De otra manera, la existencia de soluciones no triviales
se podría demostrar sin necesidad de resolver el sistema probando que la matriz de
coeficientes tiene un determinante igual a cero y, en consecuencia, que no es invertible (comprobar). A
Ejemplo 5 Demostrar que los polinomios
1 , x , x 2, . . . ) x"
forman un conjunto linealmente independlente de vectores en P,.
5.3 Independencia lineal / 279
Solución.
Sean
po= I ,
p1= x ,
p2=x2, . . . ) p n = x n
y supóngase que alguna combinación lineal de estos polinomios es igual a cero,
por ejemplo
a,p,
+ a l p , + a,p, +
' ' '
+ anpn= 0
o equivalentemente,
ao+a,x+a,x2+...+a,,x"=0
paratodaxen
(1)
(-x,")
Es necesario demostrar que
a o = a , = a , = . . . = a, = o
Para ver que así es, recordar que en álgebra un polinomio diferente de cero de
grado n tiene cuando mucho n raíces distintas. Pero esto significa que a. = al = a2
= . . . = a,,= O; en caso contrario, por ( I ) se concluiría que a. + a,x + a$ +
+
a,$' es un polinomio diferente de cero con una infinidad de raíces. A
I
'
La expresión "linealmente dependiente" sugiere que los vectores "dependen"
entre sí de alguna manera. El siguiente teorema muestra que, de hecho, asíes.
Teorema 5.3.1. Un conjunto S con dos o más vectores es:
a) Linealmente dependiente si y sólo si por lo menos uno de los vectores en S
puede expresarse como una combinación lineal de los demás vectores en S.
b ) Linealmente independiente si y sólo si ningún vector en S se puede expresar
como una combinación lineal de los demás vectores en S.
Se demostrará el inciso a) y la demostración del inciso 6 ) se deja como ejercicio.
Demostración de a). Sea S = {vl, v2, . . . , vr} un conjunto con dos o más vectores.
Si se supone queS es linealmente dependiente, entonces existen escalares
k , , k,, . . . ,
k,., no todos iguales a cero, tales que
k , v l + k,v,
Para ser específícos, supóngase que k ,
como
VI =
(-$
f
+ . . . + k , ~ =, O
(2)
O. Entonces (1) se puede volver a escribir
+. ..+
(-$
que expresa a v1 como una combinación lineal de los demás vectores en S. De
manera semejante, si kl # O en (2) para alguna j = 2, 3, . . . , r, entonces v se
J
puede expresar como una combinación lineal de los demás vectores en S.
280 i Espacios vectoriales generales
Recíprocamente, se supone que por lo menos uno de los vcctores en S se
puede expresar como una combinación lineal de los demás vectores. En concreto,
supóngase que
v , = c2v2 + c3v3 + . . + c,v,
'
de modo que
VI
c2v2 -
-
c3v3 - '
' '
- crv,. =
o
Se concluye que S es linealmente dependiente, ya que la ecuación
k , ~ +, k2v2 + . . t- k,v,. = O
'
se satisface por
k,
=
1,
k,
. . . . kr = - c,.
--c2,
que no todos son cero. La demostración para el caso en que algún vector diferente
de v, se puede expresar como una combinación lineal de los demás vectores en S
es semejante. 0
Ejemplo 6 En el ejemplo 1 se vio que los vectores
VI = (2,
- 1 , O, 3),
v2= ( I , 2,5,
-
l),
y
v3 = ( 7 ,
-
1, 5 , 8)
forman un conjunto linealmente dependiente. Por el teorema 5.3.1. se concluye
que por lo menos uno de estos vectores se puede expresar como una combinación
lineal de los otros dos. En este ejemplo, cada vector puede expresarse como una
combinación lineal de los otros dos, ya que por la ecuación 3vl + v2 - vg = O se
concluye (ver el ejemplo 1) que
VI =
-+v2
+ iv,,
v2 = - 3 v ,
+ v3,
Y
vi
=
3v,
+ v2
A
Ejemplo 7 En el ejemplo 3 se vio que los vectores i = (1, O, O), j = (O, 1, O) y k =
(O, O, 1) forman un conjunto linealmente independlente. Así, por el teorema 5.3.1
se concluye que ninguno de
estos
vectores se puede expresar como una
combinación lineal de los otros dos. Para ver directamente que esto es así,
supóngase que es posible expresar a k como
k = k,i
+ k2j
Entonces, en términos de las componentes,
(O, O, 1 )
= kl(l,
O, O) -t k,(O, 1, O)
Pero esta ecuación no se cumple para ninguno de los valores de k , y k2, de modo
que k no se puede expresar como una combinación lineal de i y j. De manera se-
5.; Independencia lineal / 281
mejante, no se puede expresar a i como una combinación lineal de j y k, y no es
posible expresar a j como una combinación lineal de i y k. A
El siguiente teoremaestablecedoshechos
lineal que es importante conocer.
sencillos sobre independencia
Teorema 5.3.2.
a> Un conjtlnto j n i t o de vectores que contiene al vector cero es linealmente
dependiente.
h) Un conjunto con exactamente dos vectoreses linealmente independiente si y
sólo si ninguno de los vectores es un múltiplo escalar del otro.
Se demostrará el inciso a ) y la demostración del inciso 6) se deja como ejercicio
Demostración de a).Para vectores cualesquiera v l . v2, . . . , v,, el conjunto S = { v l ,
v2, . . . , v,, O } es linealmente dependiente, ya que la ecuación
ov,
+ ov, + . . . + ov,. + l(0) = o
expresa a O como una combinación lineal de los vectores en S con coeficientes no
todos iguales a cero. 0
Ejemplo 8 Las funciones f, = x y f2 = sen x forman un conjunto linealmente
independiente de vectores en F( - 03, m), ya que ninguna de estas funciones es un
múltiplo constante de la otra.
INTERPRETACIÓN
GEOMÉTRICA
DE LA
INDEPENDENCIA
LINEAL
La independencia lineal posee algunas interpretaciones geométricas útiles en R2 y
R3.
o
En R2 o R3, un conjunto de dos
vectores es linealmente independiente si y
sólo si los vectores no están en la misma
recta cuando se colocan
con sus
puntos iniciales en el origen (figura 1).
a)
Figura 1
Linealmente dependientes.
b)
Linedmente dependientes.
C)
Linealmente independiente$.
282 / Espacios vectoriales generales
En R3, un conjunto de tres vectores es linealmente independiente si y sólo
si los vectores no están en el mismo plano cuando se colocan consus
puntos iniciales en el origen (figura 2).
a)
Figura 2
b)
Linealmente dependienta.
Linealmente dependientes.
c)
Linealmente independientes.
El primer resultado es una conclusión del hecho de que dos vectores son
linealmente independientes si y sólo si ninguno de ellos es un múltiplo escalar del
otro. Geométricamente, esto equivale a afrmar que los vectores no están en la
misma recta cuando se colocan con sus puntos iniciales en el origen.
El segundo resultado es una conclusión del hecho de que tres vectores son
linealmente independientes si y sólo si ninguno de ellos es una combinación lineal
de los otros dos. Geométricamente, esto equivale a decir que ninguno de los
vectores está en el mismo plano que los otros dos o, de otro modo, que los tres
vectores no están en un plano común cuando se colocan con sus puntos iniciales
en el origen (¿por qué?).
El siguiente teorema muestra que un conjunto linealmente independiente en
R" puede contener cuando mucho n vectores.
Teorema 5.3.3. Sea S (= vk,v2, . . , v,.} un conjunto de vectores en R". Si r >
n, entonces S es linealmente independiente.
,
Demostración.
Se supone que
Considérese la ecuación
k,v,
+ k2v2f .. . + k,v, = o
5.3 Independencia lineal / 283
Si, como se ilustra en el ejemplo 4, ambos miembros de esta ecuación se expresan
ls componentes y después se igualan las componentes corresponen términos dea
dientes, se obtiene el sistema
Este es un sistema homogéneo den ecuacionesen l a s r indgnitask,, k2, . . . , k,. Como
Y > n, por el teorema 1.2.1 se concluye que el sistema tiene soluciones no triviales.
Por consiguiente, S = {v,, v2, . . . , v,} es un conjunto linealmente dependiente.
u
El teorema precedente establece que un conjunto en R2 con más
de dos vectores es linealmente dependiente, y que un conjunto en R3 con más de
tres vectores es linealmente dependiente.
OBSERVACI~N.
PARA QUIENES YA ESTUDIARON CÁLCULO
INDEPENDENCIA
LINEAL DE
FUNCIONES
Algunas veces la dependencia lineal de funciones se puede deducir a partir de
identidades conocidas. Por ejemplo, las funciones
f, =sen2,, f2 = cos2x y f3 = 5
forman un conjunto linealmente dependiente en F( - a , m), ya que la ecuación
5fl
+- 5f2 - f3 = 5 sen2 x + 5 cos2 x
-
5 = 5(sen2 x
+ cos2 x>
-
5
=O
O está expresado como una combinación lineal de f,, f2 y f3 con los coeficientes no
todos iguales a cero. Sin embargo, tales identidades se pueden aplicar sólo en
situaciones especiales. Aunque no existe ningún método general para establecer
independencia lineal o dependencia lineal de funciones en F( - m, a ) ,a continuación se desarrollará un teorema que algunas veces se puede aplicar para demostrar
que un conjunto de funciones dado es linealmente independiente.
Si f, =A(.), f2 =&(x), . . . , f,, =f,(x) son funciones derivables n - 1 veces
sobre el intervalo (- m , m), entonces el determinante
284
Espacios vectoriales generales
Supóngase, porelmomento, que f,, f2, . . . , f, son vectores linealmente
dependientes en &"')(-m,
m). Entonces existen escalares k,, k, . . , k,, no
todos iguales a cero, tales que
,
k,f,(.x) i k , f , ( s )
+
' ' '
+ k,,f',,(s) o
y=
para toda x en el intervalo (- m , m). AI combinar esta ecuación con las ecuaciones
obtenidas al derivar sucesivamente n - 1 veces, se obtiene
Así, la dependencia lineal de f,, f2, . . . , f, indica que el sistema lineal
tiene una solución no trivial para toda x en el intervalo (- m, m). Esto a su vez
significa que para toda x en (- m ; m) la matriz de coeficientes no es invertible o,
de manera equivalente, que su determinante (el wronsluano) es cero para toda x en
(- m , m). Por tanto, si el wronskiano no es idénticamente cero sobre (- m, m),
entonces las funciones f,, f2, . . . , f,, deben ser vectores linealmente independientes en C("-l)(- m. m). Este es el contenido del siguente teorema:
Teorema 5.3.4. Si las funciones f,, f2, . . . , f,, tienen n - 1 derivadas continuas sobre el intervalo (- 03, m) y si el wronskiano de estas funciones no es
idénticamente cero sobre (- m, m), entonces las funciones formanun conjunto
linealmente independiente de vectores en &-l)(-m,
m).
*Józef Maria Hoetze-Wronski (1776-1853). Matemático y filósofo polaco-francés. Wrónshi recibió su
primera educación en Pomán y Varsovia. Sirvió como oficial de artilleros en el ejército prusiano en una
sublevación nacional en 1794, fue hecho prisionero por el ejército ruso y una vez liberado estudió filosofia
en varias universidades alemanas. Se nacionalizó fiancés en 1800 y terminó por establecerse en París, donde
efectuó investigaciones en an&is que lo [levaron a publicar algunos artículos matemáticos polémicos y lo
relacionaron con un famoso juicio sobre cuestiones financieras. Varios años después, su propuesta de
investigación sobre la detenninación de la longitud enel mar fue rechazada por la British Board of
Longitude y Wrónski volvió a sus estudios sobre filosofia mesiánica. En la década de 1830 investigó
infructuosamente la factibilidad de que los tractores de oruga compitiesen con el ferrocarril y pasó sus
úhimos~~enlapobrezaBastardedesutrabajomatendtiooestaba~&~e~~~ons.per
menudo conteníaresultados e ideas a
s
ia
ld
o
svaliosas. Algunos autom atribuyen este p a t h de m m n i m t o de toda
la vida a tendencias psicótiw y a una e q m x i h de la importaradade su propio trahajo.
5.3 Independencia lineal 1 285
Ejemplo 9 Demostrar que f, = x y f2 = sen x forman un conjunto linealmente
independiente de vectores en C' (- m , m).
Solución. En el ejemplo 8 se demostró que estos vectores forman un conjunto
linealmente independiente al observar que ninguno de ellos es un múltiplo escalar
del otro. Sin embargo, para fines ilustrativos, este mismo resultado se obtendrá
usando el teorema 5.3.4. El wronskiano es
Esta función e$ diferente de cero para toda x en el intervalo (- m, m) (comprobar),
de modo que f, y f2 forman un conjunto linealmente independiente. A
Ejemplo 10 Demostrar que f, = 1, f2 = dc y f3 = e& forman un conjunto
linealmente independiente de vectores en C2(- m, m).
Solución. El wronskiano es
1 e-' e Z X
w(x> = O e x 2e2'
O ex 4eZX
= 2e3'
Esta función es diferente de cero para toda x en el intervalo (- m, m) (comprobar),
de modo que f,, f2 y f3 forman un conjunto linealmente independiente. A
OBSERVACI~N. El recíproco del teorema 5.3.4 es falso. Si el wronskiano de f,,
f2, . . . , f, es idénticamente cero sobre (- m , m), entonces no es posible llegar a
ninguna conclusión respecto a la independencia lineal de {f,, f2, . . . , fn}; este
conjunto de
vectores
puede
ser linealmente independiente o linealmente
dependiente. Se omiten los detalles de la demostración.
EJERCICIOS DE LA SECCIóN 5.3
1. Explicar por qué los siguientes conjuntos de vectores son linealmente dependientes.
(Resolver este problema por inspección.)
a) u, = ( - 1, 2, 4) y u' = ( 5 , - 10, -2O)enR'
b) u I = (3, - 1). u2 = (4, 5), u) = ( - 4, 7) enR2
c) pl = 3 - 2x + x2 y p2 = 6 - 4x + 2x' enP,
286
/'
Espacios vectoriales generales
a) 2 - x + 4 x 2 , 3 + 6 x + 2 x 2 , 2 + 1 0 x - 4 x 2b ) 3 + x + x 2 2, - x + 5 x 2 4, - 3 x 2
C) 6 - x', 1 + X
4 ~ '
d) 1 3x 3x2, x 4x2, 5
+
+
+
+
+ 6x + 3x2, 7 + 2x
- x2
S. Supóngase que vl, v2 y v3 son vectores en R3 cuyos puntos iniciales están en el origen.
En cada inciso, d e t e m a r si los tres vectores son coplanares.
b)v,=(-6,7,2),v2=(3,2,4),v,=(4,-1,2)
a)v,=(2,-2,0),v2=(6,1,4),v,=(2,0,-4)
6. Supóngase que vI, v2 y v3 son vectores en R3 cuyos puntos iniciales están en el origen.
En cada inciso, determlnar si los tres vectores son colineales.
a) v , = ( - 1 , 2 , 3 ) ,
c)
VI =
- 6 ) , v,=(-3,6,0)
= (2, 3,4), vj = ( - 2 , -3, -4)
b) ~ 1 = ( 2 , - 1 , 4 ) , ~ , = ( 4 , 2 , 3 ) ,~ , = ( 2 , 7 ,- 6 )
~ 2 = ( 2 , -4,
(4, 6, 8).
v2
7. a) Demostrar que los vectores vl = (O, 3, 1, - l), v2 = (6, O, 5, 1) y v3 = (4, -7, 1, 3)
forman un conjunto linealmente dependiente en R4.
b) Expresar cada vector como una combinación lineal de los otros dos.
8. ¿,Para qué valores reales de
1 los siguientes vectores forman un conjunto linealmente
dependiente en R3?
v,
=(a, -1
2.
;),
"
v2 = ( - L 2. a,
4).
"
vj
=
(
-A -+. a)
9. Demostrar que si {vl, v2, v3} es un conjunto de vectores linealmente independiente,
entonces también {vi, v2}, {vl, v3}, {v2, v3}, {vl}, {v2} y (v3} son linealmente independientes.
10. Demostrar que si S = { v l , v2, . . . , vr} es un conjunto de vectores linealmente
independiente, entonces también todo subconjunto no vacío de S es linealmente independiente.
11. Demostrar que si {vl, v2> v3} es
un conjunto de vectores linealmente independiente en
un espacio vectorial V y v4 es cualquier vector en V, entonces {vl, v2, v3, v4) también
es linealmente independiente.
12. Demostrar que si {vl, v2, . . . , vr} es un conjunto linealmente independiente de
vectores en un espacio vectorial V y si vrtl, . . . , vn son vectores cualesquiera en
V , entonces {vI, v2, . . . , vrtl, . . . , vn} también es linealmente independiente.
13. Demostrar que todo conjunto con más de tres vectores de P2 es linealmente dependiente.
14. Demostrar que si {vI, vz} es linealmente independiente y v3 no está en lin {vl, vz},
entonces {v,, v2, v3} es linealmente independiente.
15. Demostrar: Para vectores cualesquiera u, v y w, los vectores u
forman un conjunto linealmente dependiente.
- Y, v
-w y w
-
u
16. Demostrar: El espacio generado por dos vectores en R3 es una recta que pasa por el
origen, un plano que pasa por el origen o el origen mismo.
17. ¿En qué condiciones un conjunto con un vector es linealmente independiente?
5.4 Base y dimensión / 287
18. ,$on linealmente independientes los vectores v,, v2 y v3 de la figura 3a? ¿Y los de la
figura 3b? Explicar las respuestas.
tz
Figura 3
19. Usando las identidades adecuadasdondeseanecesario,determinarcuálesde
siguientes conjuntos de vectores enF( - m , 03)son linealmente dependientes.
a) 6, 3 sen2x, 2 cos2 x
d) cos 2x,sen2 x, cos2 x
b) x, cos x
e) (3 - x)’, x2 - 6x, 5
c) l,senx, sen2x
f ) O, cos3 m , s e n 5 3 n x
20. (Para quienes ya estudiuron C&urO). Usando el wronskiano,demostrarque
siguientes conjuntos de vectores son linealmente
independientes.
a) 1, x, ex
b) sen x, cos x, x senx
los
c) e’, xe‘, x’eX
d) 1, x,
los
x2
21. Con el inciso a) del teorema 5.3.1, demostrar el incisob ) del mismo teorema.
22. Demostrar el inciso b ) del teorema 5.3.2
5.4 BASE Y DIMENSI~N
Es comúnimaginar
a una recta como unidimensional, a un plano como
bidimensional y al espacio circundantecomo tridimensional. El objetivo principal
de esta secciónes hacer precisa esta noción intuitivade dimensión.
SISTEMAS DE
COORDENADAS
NO RECTANGULARES
En geometría analítica plana se aprendió a asociar un par de coordenadas (a, b )
con un punto P en el plano alproyectar P sobreun par de ejes de coordenadas
perpendiculares (figura la). Mediante esteproceso,a
cada punto en el planose
asigna un conjuntodecoordenadasúnico
y recíprocamente,a cada par decoordenadas se asocia un punto Único en el plano. Lo anterior se describe afirmando
que el sistema de coordenadas establece una correspondencia biunivocu o uno a
uno entre puntos en el plano y parejas ordenadas de números reales. Aunque los
ejes de coordenadas perpendiculares son los más comunes,para definir un sistema
de coordenadas en el plano se puede usar cualquier par de rectas no paralelas. Por
ejemplo, en la figura lb, al punto P se han asociado las coordenadas (a, 6 ) al
proyectar P en forma paralela alos ejes de coordenadas no perpendiculares. De manera
semejante, para defimrunsistemadecoordenadasenel
espacio tridimensional es
posible usar cualquier tema de ejes de coordenadas no coplanares
(figura IC).
2811
Espacios vectoriales generales
a)
bI
('
1
coordenadas no rectangulares en el
El primer objetivoenestasecciónes
ampliar elconceptode sistema dc
coordenadas a espacios vectoriales generales. Para empezar, será de utilidad volver
a plantear el concepto de sistema de coordenadas en el espacio bidimensional o en
el espacio tridimensional usando vectores en vezdeejesde
coordenadas para
especificar el sistema de coordenadas. Esto se puede hacer sustituyendo cada eje de
coordenadas por un vector de longitud 1 que apunte en la hrección positiva del
eje. En la figura 2a, por ejemplo, v1 y v2 son tales vesores. Como se ilustra en esa
figura, si P es cualquier punto en el plano, el vector OP se puede escribir como una
combinación lineal de v1 y v2 proyectando P en forma paralela a vI y v2 a fin de que
OP sea la diagonal del paralelogramo determinadopor los vectoresmIy bv2.
-
OP = a v , +- bv,
Resulta evidente que los númerosa y b en esta fórmula vectorial son precisamente las
coordenadas deP en el sistema de coordenadas de la figura lb. De manera semejante,
las coordenadas (a,b, c) del punto P en la figura IC se pueden obtener al expresar ¿¡?
como una combinación lineal delos vectores que se muestran en la figura 26.
5.4 Base y dimensión / 289
Las escalas de mdción a lo largo de los ejes de coordenadas son ingrdentes
esenciales de cualquier sistema de coordenadas.
En términos generales,se intenta usar
la misma escala en cada eje
y situar los puntos enteros sobre los ejes una
a distancia de
1 unidad entre sí. Sin embargo, esto no siempre es práctico o apropiado: para ajustar
una gráfica particular sobre una página impresa o para representar cantidades fisicas
con varias unidades en
el mismo sistema de coordenadas (tiempo en segundos sobre un
otro eje,porejemplo)sonnecesarias
eje y temperatura en cientos de grados sobre
escalas desiguales o escalas en que la &stancia entre los puntos enteros sea mayor o
menor que 1 unidad. Cuando un sistema de coordenadas se especifica medmte un
conjunto de vectores básicos, entonces las longitudes de estos vectores corresponden a
las distancias entre puntos enteros consecutivos sobre los ejes de coordenadas
(figura 3).
Así, lo que define las direcciones positivasde los ejes de coordenadas son las
direcciones de los vectores básicos, y lo que establece las escalas de medición son
las longitudes de los vectores básicos.
-3 -2 -1
-?I
-1
-3
-2
Escalas diferentes. Ejes perpendiculares.
Figura3
Escalas iguales. Ejes oblicuos.
Escalas dikrentes. Ejes oblicuos.
La siguiente defínición clavehace más precisas los conceptos anterioresy permite
espacios
vectoriales generales.
ampliar el concepto de sistema de coordenadas
a
Definición.Si V es cualquier espacio vectorial y S = {vl, v2, . . . , vn} es un
conjunto de vectores en V. entonces S se llama base de V si se cumplen las dos
condiciones siguientes:
BASE DE UN
ESPACIO
VECTORIAL
a) S es linealmente indepenhente.
b) S genera a V.
Unabase es la generalización de espacio vectorial de un sistema de
coordenadas enelespacio bidimensional y en el espacio tridimensional. El siguiente teorema ayudará a ver por quées así.
,
Teorema 5.4.1. S i S = {vl, v2, . . . , vn} es una base de un espacio vectorial V,
entonces todo vector v en V se puede expresar en forma zinica como v == c l v , +
c2v2 + . . . + C,V,?.
I
d
Demostración. Como S genera a I/', por la definición de conjunto generador se
concluye que todo vector v en 1' se puede expresar como una combinación lineal
de los vectores en S. Para ver que sólo existe una manera de expresar un vector
como una combinación lineal de los vectores en S, supóngase que algún vector v se
puede escribir como
v
= ClV1
+ c,vz +
v
= k,v,
+ k,v, +
' '
. + c,vn
y también como
'
+ knv,
I
Restando la segunda ecuación de la primera se obtiene
c,-kl=O,
c,-k,=Q,
. . , , c,--,,=O
es decir.
C,
= k,,
c 2 = k,,
Así. las dos expresiones para v son iguales.
COORDENADAS
RESPECTO A
UNA BASE
...,
crt
= kn
U
Si S = {vl, v2, . . , vn }es una base para un espacio vectorial V y
,
v = c,v,
+ c*v2+
'
.
'
+ c,v,
es l a expresión que describe un vector v en términos de la base S, entonces los
escalares cl, c2,. . . , e,, se denominan coordenadas de v respecto a la base S. El
5.4 Base y dimensión / 291
vector (cl, c2, . . . , cn) en R" que se obtiene a partir de estas coordenadas se llama
vector de coordenadas dev con respecto a S; se denota por
(v)s = (CI,
$9
..
'
c,>
>
OBSERVACI~N. Se debe notar que los vectores de coordenadas no sólo dependen
de la base S, sino también del orden en que se escriben los vectores básfcos; un
cambio en el orden de los vectores básicos da por resultado un cambio correspondiente en el orden de los elementos en los vectores de coordenadas.
Ejemplo 1 En el ejemplo 3 de la sección precedente se demostró que si
i=(l,O,O),
l,O),
j=(O,
y
k=(O,O, 1)
entonces S = {i, j, k} es un conjunto linealmente independiente en R3. Este
conjunto también genera a R3, ya que cualquier vector v = (a, b, c) en R3 se puede
escribir como
v
= (a, b, c) = a(1,
O, O)
+ b(0, 1, O) + c(0, O, 1) = a i + bj + ck
(1)
Así, S es una basede R3; se denomina base estándar de R3. Al observar los
coeficientes de i, j y k en (1). se concluye que las coordenadas de v respecto a la
base estándar son a, b y c, de modo que
(VIS
= (a, b, c>
Comparando este resultado con (1) se observaque
v
= (VIS
Esta ecuación establece que las componentes de un vector v con respecto a un
sistema de coordenadas rectangulares xyz ya
ls coordenadas de v con respecto a la
base estándar son las mismas; así, el sistema de coordenadas y la base producen
precisamente la misma correspondencia unoauno entre puntos enel espacio
tridimensional y ternas ordenadas de números reales (figura 4). A
Figura 4
Los resu1:ados delejemplo anterior son un caso especial de los quese
presentan en el siguiente ejemplo.
BASE
ESTANDAR
PARA R"
Ejemplo 2 En el ejemplo 3 de la sección precedente se demostró que si
e , = (1, O,O, . . . , O),
e,
= (O,
1, O , . . . , O),
. . . , e,, = (O, O, O, . . . , 1)
entonces
es un conjunto linealmente independiente de R". Este conjunto también genera a
R", ya que cualquier vector v = (vl. v2, . . . ,vn) en R" se puede escribir como
Así, S es una base de R"; se denomina base estándar de R". Por (2) se concluye que las coordenadas de v = (vl, v2, . . . , vn) respecto a la base estándar
son v l , v2, . . . , vn, de modo que
(VIS
= (u,,
u23
' ' ' 1
u,)
Como en el ejemplo 1, aquí también se tiene que
v
=w
7
.
de modo que unvector v y su vector de coordenadas con respecto a la base
estándar de R" son iguales. A
OBSERVACI~N. En otro ejemplo se verá que un vector y su vector de coordenadas
no son los mismos; la igualdad observada en los dos ejemplos precedentes es una
situación especial que ocurre sólo conla base estándar de R".
En RZ y en R3, los vectores estándar básicos suelen denotarse por
i, j y k, en vez de por e l , e, y e3. Aquí se usarán ambas notaciones, dependiendo
de la situación particular.
OBSERVACI~N.
Ejemplo 3 Sean v1 = (1, 2, l), v2 = (2, 9, O) y v3 = ( 3 , 3, 4). Demostrar que el
conjunto S = v l , v,, v3 es una base deR3.
Solución. Para probar que el conjunto S genera a R3 es necesario demostrar que
un vector arbitrario b = (bl, b,, b 3 ) se puede expresar como una combinación
lineal
b = c i v l + c2v2+ c3v3
5.4 Base y dimensión / 293
de los vectores en S. Expresando esta ecuación en términos de las componentes se
obtiene
o bien, igualando las componentes correspondientes,
+ 2c2 + 3c3 = h ,
2c, + 9c2 + 3c3 = h2
+ 4c, = b,
CI
CI
Así, para probar que S genera a R3 es necesario demostrar que el sistema (3) tiene
una solución para todas las elecciones de b = (6
6-J.
Para probar que S es linealmente independlente, se debe demostrar que la
única solución de
,,t2,
es c1 = c2 = c3 = O. Como antes, si (4) se expresa en términos de las componentes,
entonces la comprobación de la independencia lineal se reduce a demostrar que el
sistema homogéneo
sólo tiene la solución trivial. Obsérvese que los sistemas (3) y (5) tienen la misma
matriz de coeficientes. Así, por los incisos a), b ) y g) del teorema 4.3.4 se puede
probar en forma simultánea que S es linealmente independiente y que genera a H3
al demostrar que en los sistemas (3) y (5) la matriz de coeficientes
1 2 3
1
0
posee un determinante diferente de cero. Pero
4
294
/
Espacios vectoriales generales
de modo que S es una base para R3. A
Ejemplo 4 Sea S = {vl, v2. v3] la base de R3 en el ejemplo precedente.
a) Encontrar el vector de coordenadas de v = ( 5, - 1, 9) con respecto a S.
b) Encontrar el vector v en R3 cuyo vector de coordenadas con respecto a la base
S e s ( v ) , ~ =(-1. 3. 2).
Solución de a). Es necesario encontrar escalares cl, c2, c3 tales que
v = c,v, + c2v2 + c3v3
o bien, en términos de las componentes.
( 5 , - I , 9) = c,(l, 2, 1)
+ c2(2,9, O ) + c3(3, 3,2'
Igualando las componentes correspondientes se obtiene
C1
2C,
+ 2C2 f 3C3 5
+ 9C2 + 3C3 = - 1
CI
Resolviendo este sistema se obtiene c1
consiguiente,
zz
+4c, =
= 1,
(v)s = (1,
Soluciónde h).
obtiene
v
c2
9
= - 1,
c3
=
2 (comprobar). Por
- 1, 2)
Aplicando la definición delvectorde
coordenadas ( v ) ~ ,se
= ( - l ) ~+, 3 ~ +
22 ~ 3
=(-1)(1,2, 1)+3(2,9,0)+2(3, 3,4)=(11,31,7) A
Ejemplo 5
a) Demostrar que S = { 1 , x, x*, . . . . x"} es una base para el espacio vectorial Pn
de polinomios de la forma a. + alx + . . . + a&'.
b) Encontrar elvector de coordenadas del polinomio p a. + alx + a2x2 con
respecto a la base S = { 1, x, x,} para P,.
Solución de a). En el ejemplo 11 de la sección 5.2 se demostró que S genera a
P2, y en el ejemplo 5 de la sección 5.3 se demostró que S es un conjunto
linealmente independiente. Así, S es una base para P,; se denomina base estándar
para P,.
Solución de a). Las coordenadas de p = a. + a l x + a2x2 son los coeficientes
= (ao,a l , a,). A
escalares de los vectores básicos 1, x y x2, de modo que
5.4 Rase y dimensión 1 295
Ejemplo 6 Sean
El conjunto S = {M1,M,, M3, M4) es una base para el espacio vectorial
de
matrices 2 x 2. Para constatar que S genera a M,,, obsérvese que unvector
(matriz) cualesquiera
se puede escribir como
Para constatar que S es linealmente independiente, supóngase que
aM, + bM2 + CM, + dA4,
Es decir,
'I+#
a [ 'O O
0 ]+b[O
O 0
=O
: ] + d [ oO 0I]=[:
:]
Se concluyeque
Así, a = b = c = d = O, de modo que S es linealmente indepenjiente. La base S en
este ejemplo se denomina base estúindar para M2,. De manera más general, la
base estándar para Mnn consta de las mn matrices diferentes que tienen un solo 1
y cuyos elementos restantes son ceros. A
Ejemplo 7 Si S = {vl, v,, . . . , vr} es un conjunto linealmente independiente en
un espacio vectorial V, entonces S es una base para el subespacio lin (S?, ya que
por definicibn de lin ( S ) e! conjunto S genera a lin (S). A
DIMENSI~N
Definición. Se dice que un espacio vectorial Y diferente de cero es de dimensión
finita si contiene un conjunto finito de vectores vl, v2, . . . , v,, que forma una
base. Si es así, se dice que V es de dimensión infinita. Además, se considera
que el espacio vectorial cero es de dimensión finita.
A
Ejemplo 8 Por los ejemplos 2, 5 y 6, los espacios vectoriales R", Pn y M,,,, son de
dimensión finita. Los espacios vectoriales F(- m , m ) , C(- m , m ) , Cm(- m , w)
y C" (- m , m) son de dimensión infinita (ejercicio 23). A
296
,I
Espacios vectoriales generales
El siguiente teorema proporciona la clave del concepto de dimensión
vn} es cualquier base, entonces:
a ) Todo conjunto con más de n vectores es linealmente dependiente.
6) Ningún conjunto con menos de n vectores genera a V.
Demostración de a).Sea S = { w l , w 2 , . , w m }cualquier conjunto de m vectores
en I,', donde m > n. Se quiere demostrar que S es linealmente dependiente. Como
S = {v,, v2, . . . , vn} es una base, todo wi se puede expresar como una combinación lineal de los vectores en S, por ejemplo
, ,
Wl
=
U,,V,
+ u21v2 - t . . + a,,v,
+
+ . . . + an2v,
'
w2 = a12v1 a2,v2
w,
= Ul,VI
+ a2,v2 + . . + U n m V ,
'
Para demostrar que S es linealmente dependente, es necesario encontrar escalares
k , , k,, . . . , k,,, no todos cero, tales que
Usando las ecuaciones en (6), la expresión (7) se puede volver aescribir como
(k,u,1
" k,a,2 +
' ' '
+ kmUlm)V,
+ (k1a,, + k2a,, + . . . + kma2,,,)v2
+ (k,a,, + k2an2+ . . . + ~,u,,,,)v, = O
Así, a partir de la independencia lineal de S, el problema de demostrar que S es un
conjunto healmente dependiente se reduce a probar que existen escalaresk,, k,, . . . ,
km, no todos cero, que satisfacen
+
+ . . + q m k m= o
a , , k , +- a2,k, + . . . + a,,k, = O
a,,!%, a,,k,
an,kl
'
(8)
+ a,2k2 + . . . + anmkm= O
Pero (S) contiene más incbgnitas que &ones, de modo que
la demostración está
completa, ya queel teorema 1.2.1 garantiza la existencia de soluciones
no triviales.
Demostración de b). Sea S = {wl, w,, . . . , wm}cualquier conjunto de m vectores
en V, donde m < n. Se quiere demostrar que S no genera a V. La demostración
será por contradicción: Se demostrará que suponiendo que S genera a V se llega a
una contradicción de la independencia lineal de {vl, v2, . . . , vn}.
5.4 Base y dimensión / 297
Si S genera a V, entonces todo vector en V es una combinación lineal de 10s
vectores en S . En particular, cada vector básico vi es una combinación lineal de
los vectores en S , por ejemplo,
+
v, = a l l w l + a Z I w 2 . . . + a , , ~ ,
v2 = a 1 2 w l+ a22w2+ . . + am2w,
'
v, = a,,w,
+ a2nW2 + . . . + c,,w,
Para obtener la contradicción, se demostrará que existen escalares k,, k2, . . . , km,
no todos cero,tales que
k , ~+, k2v2+ . . . + k,v, = O
(10)
Pero obsérvese que (9) y (10) son de la misma forma que (6) y (7), excepto que se
han intercambiado m y n, así como las w y las v. Por tanto, los cálculos con los
que se llegó a (8) ahora producen
a,,k,
a2,k,
+ a I 2 k 2+ . . . + a&,
+ a2,k2 + . . . + a2,k,
O
=O
=
Este sistema lineal contiene más incógnitas que ecuaciones y por el teorema 1.2.1,
posee soluciones no triviales. 0
Del teorema precedente se deduce que si S = {vl, v2, . . . , v,,} es cualquier
base para un espacio vectorial V, entonces todos los conjuntos en V que
simultáneamente generan a V y son linealmente independientes deben tener precisamente n vectores. Así, todas las bases de Vdeben tener el mismo número de vectores que la base arbitraria S. Esto lleva al siguiente resultado, que es uno de los
más importantes en álgebra lineal.
1
Teorema 5.4.3. Todas las bases de un espacio vectorial de dimensión jinita
tienen el mismo númerode vectores.
Para ver cómo se relaciona este teorema con el concepto de "dimensión",
recuérdese que la base estándar para R" tiene n vectores (ejemplo 2). Así,el
teorema 5.4.3 indica que todasa
ls bases de R" tienen n vectores . En particular,
cualquier base para R3 tiene tres vectores, cualquier base para R2 tiene dos
vectores, y cualquier base para R' (R) tiene un vector. Intuitivamente, R3 es
tridimensional, R2 (un plano) es bidimensional, y R (una recta) es unidimensional.
Así, para espacios vectoriales conocidos, el número de vectores que hay en m a
base es igual a la dimensión. Este hecho sugiere la siguiente definición.
298 / Espacios vectoriales generales
Ejemplo 9
dim@") = n La base estándar tiene n vectores (ejemplo 2).
dim(Pn) = n + 1 La base estándar tiene n + 1 vectores (ejemplo 5)
dim(Mmn)= mn La base estándar tiene mn vectores (ejemplo 6).
Ejemplo 10 Determinar una base para y la dimensión del espacio solución del
sistema homogéneo
2x, + 2x,
-
x2
+ 2x,
+
x2
-
.x1
+x,=o
x3
- x, -
-
3x,
+xg =o
o
xi + xq + x5 = o
2x,
- .x5
=
Solución. En el ejemplo 6 de la sección 1.2 se demostró que la solución general
del sistema dado es
Por consiguiente, los vectores solución se puedenescribir como
lo cual demuestra que los vectores
"
j
O
O
generan el espacio solución. Como también son linealmente independientes (comprobar), {vl, va} es una base y el espacio solución es bidimensional. A
5.4 Base y dimensión / 299
ALGUNOS
TEOREMAS
FUNDAMENTALES
El resto de esta sección se dedicará a una serie de teoremas que revelan las sutiles
relaciones que hay entre los conceptos de generación, independencia lineal, base y
dimensión. Estos teoremas no son ejercicios vanos de matemáticas teóricas; porel
contrario, son esenciales para comprender los espacios vectoriales y muchas aplicaciones prácticas del álgebra lineal se basan en ellos.
El siguienteteorema,que
en estelibro se denomina Teorema M&/Menos,
establecedosprincipiosbásicos
en los que se basan la mayoríade los teoremas
subsecuentes.
Teorema 5.4.4. (Teorema MádMenos). Sea S un conjunto no vacío de vectores en un espacio vectorial I/:
a ) Si S es un conjunto linealmente independiente y v es un vector en V que no
pertenece a [in (SI, entonces el conjunto que se obtiene al incluir v en S
aún es linealmente independiente.
6 ) Si v es un vector en S que se puede expresar como una combinación lineal
de los demás vectores en S, y si S - {v} denota el conjunto que se obtiene
al quitar v de S, entonces S y S - { v) generan el mismo espacio;es decir,
I
lin
6s) = lin ( S - {v})
La demostración se pospone hasta el final de la sección para poder estudiar de inmediato las consecuencias del teorema. Sin embargo, el teorema se puede representar en R3 como sigue:
a)
Un conjunto S de dos vectores linealmente independientes en R3 genera un
plano que pasa por el origen. Si S se aumenta insertando cualquier vector v
fuera de este plano (figura 5a), entonces el conjunto resultante de tres vectores
todavía es linealmente independente, ya que ninguno de los tres vectores está
en el mismo plano que los otros dos.
6 ) Si S es un conjunto de tres vectores no colineales en R3 que están en un plano común que pasa por el origen (figura5b), entonces los tres vectores generan el plano.
Sin embargo, si de S se quita cualquier vector v que sea una combinación lineal de
los otros dos, entonces el conjunto restante de dos vedores sigue generando el plano.
b)
Ninguno de los tres
vectores está en el mismo
Cualquiera de los vectores
se puede eliminar y los dos
restantes siguen generando
Figura 5
". . -.
,".I
..
. .
.
".
I
C)
se puede eliminar y los dosrestantes
300 / Espacios vectoriales generales
En general, para probar que un conjunto de vectores {vl, v2, . . . , v,,} es una
base de un espacio vectorial V, se debe demostrar que los vectores son linealmente
independientes y generan a Y, Sin embargo, si se sabe que la hmensión de Ves n
(de modo que {vl, v2, . . . , v,,} contiene el número adecuado de vectores para una
base), entonces basta verificar y a sea, la independencia lineal o la generación: la
otra condición se cumple automáticamente. Este es el contenido del siguiente
teorema.
Teorema 5.4.5. Si V es un espaciovectorialde dimensión n y si S es un
conjunto en V con exactamente n vectores, entonces S es una base de I.’ si S
genera a V o si S es linealmente independiente.
Demostración. Supóngaseque S contieneexactamente
n vectores y que
genera a C’. Para probar que S es una base es necesario demostrar que S es un
conjunto linealmente independiente. Pero si no es así, entonces algún vector v
en S es una combinación lineal de los demás vectores. Si este vector se quita
de S, entonces por el Teorema MáslMenos (teorema 5.4.46) se concluye que el
conjunto restante de n - 1 vectores aún genera a V. Pero esto es imposible, ya
quepor el teorcma 5.4.26 se deducequeningúnconjuntocon
menos de n
vectores puede generar un espacio vectorial de dimensión n. Así, S es linealmente independiente.
Supóngase que S contiene exactamente n vectores y que es un conjunto
iinealmente independiente. Para probar que S es una base se debe demostrar
que S genera a V. Pero si ésto no es así, entonces en V existe un vector v que
no está en lin (S). Si este vector seincluye en S, entoncesporelTeorema
MásMenos (teorema 5 . 4 . 4 ~se
) concluye que este conjunto de n + 1 vectores
aún es linealmenteindependiente.Peroesto
es imposible, ya que por el
teorema 5.4.2a se concluye que ningún conjunto con más de n vectores en un
espacio de dimensión n puede ser linealmente independiente. Así, S genera a
v. n
Ejemplo 11
Demostrar por inspección que v I = ( - 3 , 7 ) y v2 = (5, 5 ) forman una base para
R2.
Demostrar por inspección que v 1
forman una base para R3.
=
(2, O, - I), v2 = ( 4 , o, 7) y v3 = (- 1,1, 4)
Solución de a). Como ninguno de los vectores es un múltiplo escalar del otro, los
dos vectores forman un conjunto linealmente independiente en el espacio bi&mensional R2 y, entonces, por el teorema 5.4.5, forman una base.
Solución de 6). Los vectores v1 y v2 forman un conjunto linealmente independiente en elplano xz ($or qué?). El vector v3 está fuera del plano xz, de nlods que
5.4 Base y dimensión / 301
el conjunto {vl, v2, v3} también es linealmente independiente. Como R3 es
tridimensional, el teorema 5.4.5 indica que {vl, v2, v3} es una base para R3. A
El siguiente teorema muestra que para un espacio vectorial V de dtmensión
finita todo conjunto que genera a V contiene una base para V, y que todo conjunto
linealmente independiente en V forma parte de alguna base para V.
~~~
~~~
Teorema 5.4.6. Sea S un conjunto de vectores en un espacio vectorial V de
dimensiónjnita.
a ) Si S genera a V pero no es una base de V, entonces S se puede reducir a
una base de V quitando de S los vectores adecuados.
6 ) Si S es un conjunto linealmente independiente que y a no es una base para
V , entonces S se puede agrandar hasta constituir una base para V
insertando en S los vectores apropiados.
Demostración de a). Si S es un conjunto de vectores que genera a V pero no
es una base para V, entonces S es un conjunto linealmente dependiente. Así,
algún vector v en S se puede expresar como una combinación lineal de
los
demás vectores en S. Por el Teorema Máshlenos (teorema 5.4.46), es posible
quitar v de S y el conjunto resultante S ' sigue generando a V. Si S ' es linealmente independiente, entonces S' es una base para V y ya se ha terminado. Si
S es linealmente dependiente, entonces es posible quitar de S ' algún vector
adecuado a fin de obtener un conjunto S ' que siga generando a V. Se puede
continuar quitando vectores de esta manera hasta que, por último, se llega
a
un conjunto de vectores enS que sea linealmente independiente y genere a V.
Este subconjunto de S es una base para V.
Demostración de 6).Supóngase que dim(Cr) = n. Si S es un conjunto linealmente
independiente que no es UM base para V, entonces S no genera a V y existe un
vector v en V que no está en lin (S). Pero por el Teorema MásMenos (teorema
5.4.4a), es posible insertar v en S, y el conjunto resultante S aún es linealmente
independiente. Si S genera a V, entonces S es una base para V y ya se ha
terminado. Si S no genera a V, entonces es posible insertar un vector apropiado en
S para obtener un conjunto S' que siga siendo linealmente independente. Es
posible continuar insertando vectoresde esta manera hasta que se llega a un
conjunto con n vectores linealmente independientes en V. Por el teorema 5.4.5,
este conjunto es unbase para V.
En la siguiente sección se dan ejemplos numéricos que ilustran el teorema
precedente.
Esta sección concluye con un teorema que muestra que la dimensión de un
subespacio de un espacio vectorial V no puede exceder la dtmensión de V mismo, y
que la única forma en que un subespacio puedetener la misma dimensión que Ves
cuando el subespacio es todo el espacio vectorial V. En la figura 6 se ilustra esta
.-.. .
302
,I
Espacios vecloriaies generales
idea para R3. En esa figura se observa que aumenta la dimensión de subespacios
sucesivamente más grandes.
Recta que Pasa por el origen 1
(1-unidirnensionalj
1
1
Origen
(dimensión O)
I
Figura 6
~~
~~~
~~
~~~
~
~~
~
Teorema 5.4.7. Si W es un subespacio de un espacio vectorial Y de dimensión
,finita. entonces dim(W) 5 dim(l.9;además, si dim(W) = dim(4, entonces W = V.
*
Demostración. Sea S = { wl, w,, . . . , wm} una base para W. S puede ser una
base para V o no. Si es así, entonces dim(w = &m(V) = m. Si no es así, entonces,
porel
teorema 5.4.66, es posible agregar vectores al conjunto linealmente
independiente S a fin de convertirlo en una base para Y de modo que dim(JV) <
&m( 4. Por tanto, d i m ( q 5 & m ( q en todos los casos. Si dim( W) = dim(V),
entonces S es un conjunto de m vectores linealmente independientes en el espacio
vectorial Vde dimensión m ;por tanto, debido al teorema 5.4.5, S es una base para
V. Esto signifíca que W = Y (¿por qué?). 0
MÁS DEMOSTRACIONES
Demostración del teorema 5.4.4a Supóngase que S = {y1, v2, . . . , vr} es un conjunto linealmente independiente de vectores en V y que v es un vector en I/’ fuera
de lin (S). Para probar que S = {vl, v2, . . , vr, v} es un conjunto linealmente
independiente, es necesario demostrar que los únicos escalares que satisfacen
,
k,v, + k2v2 +
’ ’ ‘
+ k,v, + k,,
,v = o
(1 1)
son k , = k , = . . . = k = k r+l = O. Pero se debe tener que k r+l = O; en caso
contrario, v se podría despejar en (11) como una combinación lineal de vl, v2, . . . ,
Y,, contrakciendo la hipótesis de que v es un vector que no pertenece a lin (S).
Así, (1 1) se simplifica a
k,v, + k2v2+ . . . + k , ~ ,= O
lo cual, debido a la independencia lineal de v,, v,, . . . , vr , sigrufíca que
k I -- k
2 -
= k =O.
(12)
5.4 Base y dimensión / 303
Demostración del teorema 5.4.4b Supóngase que S = {vl, v2, . . . , vr} es un
conjunto de vectores en V y, para ser específícos, supóngase que v, es una
combinación lineal de vl, v2, . . . , v,- 1, por ejemplo
Se quiere demostrar que v,si se quita de S, entonces el conjunto de vectores restante
(vl, v2, . . . , v,.-~} sigue generando a lin (9;es decir, se debe demostrar que todo
vector w en lin (S) se puede expresar como una combinación lineal de {y1, v2, . . . ,
vr- 1}. Pero si w está en lin (S), entonces w se puede expresar en la forma
o bien, sustituyendo en (13)
que expresa a w como una combinación lineal de vl, v2, . . . ,vr-
EJERCICIOS DE LA SECCIóN 5.4
1. Explicar por qué los siguientes conjuntos de vectores no son bases de los espacios
vectoriales indicados. (Resolver este problema por inspección.)
a) u, = (1, 2), u2 = (O, 3), uj = (2, 7) para R2
b ) u l = ( - 1 , 3 , 2 ) , u,=(6,1,1)paraR3
C) pI = 1 + x + x2, p2 = x - 1 para P2
2. LCuAles de los siguientes conjuntos de vectores son bases para R2?
a1 (2, 11, (3, 0)
b) (4,
11, (-7,
C) (0, O), (1, 3)
-8)
(d) (3,9), (-4, - 12)
3. ¿Cuáles de los siguientes conjuntos de vectores son bases para R3?
a) (1, O, 01, (2,2, O), (3,3, 3)
b) ( 3 , 1, - 4h (2, 5, 6h (1,4, 8)
C) (2. - 3 , 11, (4, 1, I ) , (0, -7, 1)
d) (1, 6, 41, (2, 4, - 11, ( - 1, 2, 5)
4. ¿Cuáles de los siguientes conjuntos de vectores son bases para P2?
a) 1 - 3 X + 2 ~ ~ , 1 + ~ + 4 ~ ~ , 1 - 7b~) 4 + 6 x + x 2- 1
, +4x+2x2,5+2x-x2
c) 1 + x + x 2 , x + x 2 , 2
d) - 4 + ~ + 3 ~ ~ , 6 + 5 ~ + 2 ~ ~ , 8 + 4 x + x '
5. Demostrar que el siguiente conjunto de vectores es una base paran/iZ2.
[:
-0611
[-Y
-:I9
[-I:
3
[ -; :]
6. Sea Vel conjunto generado por v l = cos2 x, v2 = sen2 x, v3 = cos 2x
a) Demostrar que S = { y 1 , v2, v3} no es una base para V.
b) Determinar una base para V.
7. Encontrar el vector de coordenadas de w con respecto a la base S = {u], u2}para R2
u
304
,I
Espacios vecforiales generales
a) u l = ( l , O ) . u ~ ~ ( OI ) ; , ~ = ( 3 -,7 )
c) u, = ( I , I ) , u, = ( O , 2); w = (u, h )
b)
U,
= ( 2 , -4), ~ , = ( 3 , 8 ) ;w = ( l , 1)
8. Hallar el vector de coordenadas de v con respecto a la base S = {v,, v2, vi}
a) v = (2, - I , 3 ) ; V I = ( I , O, O), v, = (2, 2,O), v3 = ( 3 , 3, 3)
b ) v = ( 5 . --12,3); ~ , = ( 1 , 2 , 3 ) ,v 2 = ( - 4 , 5 , 6 ) , v 3 = ( 7 , - 8 . 9 )
Y. Encontrar el vector de coordenadas de p con respecto a la base S = { p l , p2, p3}.
a) p = 4 - 3x + x * ; p, = 1, p2 =x, p3 = x2
b) p = 2 - X
x'; p I = 1 + X , pz = 1 + x2, p1 = X + X'
10. Determinar el vector de coordenadas de A con respecto a la base S = {A,, A,, A,, A4}.
+
En los ejercicios del 1 1 al 16, determinar la dimensión y una base para el espacio solución
del sistema.
11.
x , + x , - xi = o
13. x , - 4x,
3x3 - x4 = o
12. 3r, +x, +x, + x 4 = o
- 2x, - x, 2x3 = o
5x, - x,
xj - x4 = o
2 ~ -, 8x2 + 6x3 - 2x4 O
+
+ x, = o
- 3x, + x3 = O
+
+
-x,
14.
X,
2x, - 6x2
3x,
-
+ 2 ~ =, O
+ 3x3 = O
+ 5x, = o
x, + xj = o
15. 2x, +x,
9x, -t3x, = o
x,
16. x + y + z = O
3x+2y-2z=O
4xf3y-
z=o
6x+5y+ z=O
17. Determinar bases para los siguientes subespacios de R3.
a) El plano 3x - 2y+ 5z = O.
b) El plano X - = O.
c) L a r e c t a x = 2 t , y = - t , z = 4 t .
d) Todos los vectores de la forma (u, 6 , e), donde b = u + c
18. Dar las dimensiones de los siguientes subespacios de p.
a) Todos los vectores de la forma (a,b, c, O).
b) Todos los vectores de la forma (a,b, c, d), donde d = a + b y c = u
c) Todos los vectores de la forma (u, b, c, d), donde u = b = c = d.
- b.
20. Encontrar un vector estándar básico que se pueda agregar al conjunto { v , , vz} para
obtener una base paraR3.
a ) v , = ( - 1 , 2 , 3 ) v, , = ( l , - 2 ,
-2)
b ) v , = ( l , -l,O),
vz=(3,1,-2)
21. Encontrar vectores estándar básicos que se puedan agregar al conjunto {vi, v2} para
obtener una basepara p.
v , = ( l , - 4 , 2 , -3),
~ , = ( - 3 , 8 , -4,6)
22. Sea { v I , v2, vj} una base de un espacio vectorial V. Demostrar que {ui, u2, u3} también es una base, donde u1= Y , , u2 = v i + v2 y u3 = v, + v2 + v3.
5.4 Base y dimensión / 305
23. a) Demostrar que para todo entero positivo n, en F( - m , m ) se puede hallar n + 1 vectores linealmente independientes. [Sugerencia Buscar polinomios.]
b) Usar el resultado del inciso a) para demostrar que F( - m , m) es de dimensión
mfihita.
c) Demostrar que C( - m ,
dimensión m f i i t a .
m),
Cm(- m ,
m)
y C (- m ,
m)
son espacios vectoriales de
24. Sea S una base de un espacio vectorial V de dimensión n. Demostrar que si v l , v2, . . .
vr forman un conjunto linealmente independiente de vectores en V, entonces los vectores de coordenadas ( v ~ (vJS,
) ~ . . . , (v& forman un conjunto linealmente independiente en R" y recíprocamente.
25. Usando la notacióndel ejercicio 24, demostrarque si v l , v2, . . . vr generan a V,
entonces los vectores de coordenadas ( v ~ ) (v,&
~ , . . , , ( v ~ generan
) ~
a R" y recípro-
camente.
26. Encontrar una base parael subespacio deP2 generado por los vectores dados.
a) - 1 + x - 2x2, 3 + 3x + 6 2 , 9
b) 1 +x, x2, -2+2x2,-3x
C) 1 + X - 3x2, 2 + 2~ - 6x2, 3 + 3~ - 9x2
[Sugerencia Sea S labase
estándar para P2 y trabájese con los vectoresde
coordenadas relativos a S; consultar los ejercicios 24 y 25.1
21. En l a figura 7 se muestran un sistema de coordenadas rectangularesxy y un sistema de
coordenadas x)' con ejes oblicuos. Suponiendo que en todos los ejes la escala mide 1
unidad, encontrar las coordenadas xy de los puntos cuyas coordenadas xy se proporcionan.
b) (1,O).
c) (O, 1).
d) (a,b).
a> (1, 1).
X'
Figura 7
28. En la figura 8 se muestran un sistema de coordenadas rectangularesxy determinado por
los vectoresunitarios básicos i y j y un sistema de coordenadas xy determinado por los
vectores unitarios básicos u1 y u2. Encontrara
ls coordenadas xy de los puntos cuyas
coordenadas xy se proporcionan.
5.5 ESPACIO RENGLÓN, ESPACIO COLUMNA Y ESPACIO NULO
Se enipezard con algunas definiciones.
VECTORES
R E N G L ~ NY
VECTORES
COLUMNA
Definicidn. Para una matriz m
X n
r
los vectores
-=: [%!
' '
.
U?
,
3
Rn formados a partir de los renglones de A se denomin
1, y los vectores
:II
:n
Rm
ores renglón de
fonuados a partir de las columnas de 11se denominan vedores columna
IcA.
I
Ejemplo I Sea
"I
'
"i
4
los vectores renglón de A son
r,=[2 I
O]
y
r,=[3
-1
41
5.5 Espacio renglón, espacio columna y espacio nulo / 307
y los vectores columna de A son
La siguiente definición caracteriza tres espacios vectoriales importantes asociados con una matriz.
~~~~
ESPACIO
COLUMNA,
ESPACIO
RENGLÓN Y
ESPACIO NULO
Definición. Si A es una matriz m x n, entonces el subespacio de R" generado
por los vectores renglón de A se denomina espacio renglón de .4, y el subespacio
de R"' generado por los vectorescolumna de A se denomina espacio columna de
A . El espacio solución del sistema de ecuaciones homogéneo A x = O , que es un
subespacio deR", se denomina espacio nulo de A .
En esta sección yen la siguiente se abordarán las siguientes preguntas generales:
¿Qué relaciones existen entre las soluciones de un sistema lineal A x = b y
el espacio renglón, el espacio columna y el espacio nulo de la matriz de
coeficientesA ?
¿Qué relaciones existen entre el espacio renglón, el espacio columna y el
espacio nulo de una matriz?
Para investigar la primera de tales preguntas, supóngase que
.
Por la fórmula (7) de la sección 1.3 se concluye que si cl, c2, . . . c, denotan los
vectores columna de A , entonces el producto A x sepuede expresar como una
combinación lineal de estos-vectores columna con coeficientes de x; es decir,
A x = x , c I + x2c2 + . . . + X,C,
(1)
A s í , un sistema lined Ax = b de m ecuaciones conn inujgnitas se puede escribir como
xlcI
de donde se concluye que A x
+ x2c2+ . . . +
=b
X,C,
=b
(2)
es consistente siy sblo si b se puede expresar como
una combinación lineal de los vectores columna deA o, equivalentemente, si y sólosi
b está en el espacio columna de A . Lo anterior conduce al siguiente teorema.
Teorema 5.5.1. Un sistema de ecuaciones lineales Ax
sólo si b está en el espacio columna de A .
=
b es consistente si y
Ejemplo 2 Sea Ax
= b el
sistema lineal
Demostrar que b está en el espacio columna de A , y expresar b como una
combinación lineal de los veclores columna de A.
Solución. Resolviendo el sistema por eliminación gaussiana se obtiene
(comprobar)
x, = 2 ,
x2
=
-
x3 = 3
1,
Como el sistema es consistente, b está en el espacio columna de A , además, por ( 2 )
y la solución obtenida, se concluye que
RELACIQN
ENTRE LAS
SOLUCIONES DE
Ax = O Y LAS
SOLUCIONES DE
Ax=b
El siguiente teorema establece una relación fundamental entrea
ls soluciones de un
sistema lineal no
homogéneo
Ax = b y las del sistema lineal homogéneo
correspondienteAx = 0 con la misma matriz de coeficientes.
spacio nulo de A, es decir, el espacio solución del sistema homogéneo A x
ntonces todasolución de Ax = b se puede expresar en la forma
x = X"
+ C l V l + c2vz +
' ' '
= O.
+ CkVk
y , recíprocamente, para todas las elecciones de los escalares c l , c2, . . . , ck, el
vector x en esta fórmula es una solución de Ax = b.
Demostración. Supóngase que x. es cualquier solución fija de Ax
una solución cualesquiera. Entonces
y
Ax,= b
Ax=b
Al restar estas ecuaciones se obtiene
=
o
xo) =
o
Ax - A x ,
O
A(x
-
=
b, y que X es
5.5 Espacio renglón, espacio columna y espacio nulo / 309
lo cual indica que x - x. esunasolución del sistema homogéneo A x = O.
Como vl, v2, . . . , vk es una base para el espacio solución de este sistema,
entonces x - x. se puede expresar como unacombinaciónlinealdeestos
vectores, por ejemplo
x
-
X" = C , V ,
+ c2v2 +
' ' '
+ CkVk
Por tanto,
x = xg
+
CIY]
CZVz
' ' '
+ CkVk
lo que demuestra la primera parte del teorema. Recíprocamente, para todas las
elecciones de los escalares cl, c2,. . . , ck en (3) se tiene
Ax
= A(x,
+ C l V i + c2v2+
t CkVk)
' ' '
O
Ax
= Ax,
+ c,(Av,) 3- C2(AV2) + .
'
.
+ Ck(AVk)
Pero x. es una solución del sistema no homogéneo y v l , v2, . . , vk son soluciones
del sistema homogéneo, de modo que la idtima ecuación lndlca que
~
lo cual muestra que x es una solución de Ax = h.
0
Hay cierta terminología asociada con la fórmula ( 3 ) . El vector x.
se denomina solución particular de Ax =La expresión x. + c l v l + c2v2 f . . . , +
ckvkse llama solución general de A x = b, y la expresión clvl + c2v2 + . . . , + ckvk
se conoce comosolución general de A x = O. Con esta terminología, la fórmula (3)
establece que la solución general de A x = b es la suma de cualquier solución
particular de A x = b y la solución general de A s = O.
OBSERVACI~N.
Para sistemas lineales con dos o tres incógnitas, el teorema 5.5.2 posee una
interpretación geométrica interesante en R2 y en R3. Por ejemplo, considérese el
caso en que A x = O y Ax = b son sistemas lineales condos incógnitas. Las
soluciones de Ax = O forman un subespacio de R2 y, por tanto constituyen una
recta que pasa por el origen, sólo el origen o todo R2. Por el teorema 5.5.2, las
soluciones de A x = b se pueden obtener sumando cualquier solución particular de
Ax = b, porejemplo xo, a las soluciones de A x = O . Suponiendo que x. está
colocado con su punto inicial en el origen, esto tiene elefectogeométricode
trasladar el espacio soluciónde Ax = O demodo que el punto en el origen se
mueve hacia la punta de x. (figura 1). Esto significa que los vectores solución de
A x = b forman una recta que pasa por la punta de
el punto en la punta de x*, o
todo R2. (¿Puede el lector imaginar el Ú h m raso?! De marma semtjante. prrra
sistemas lineales contres incligl'hits, I;I: so!ucioms de A x -= b constituyen un
plano que pasa por l a punta de cuaicyjier scllnci6rr $. ~.lZicuHsrx*. una recta que pasa
por la punta de x0? o todo R 3 .
~0.
310
,/
Espacios vectoriales generales
I
Espacio solución
deAx = O
Figura 1
Ejemplo 3 En el ejemplo 3 de la sección 1.2 se resolvióel sistema lineal no
homogéneo
x, 3- 3x,
Lx,
"
2x,
+ 6x2 - 5x3 5x,
2x1
+ 6x2
+
+
t 2x5
= o
2x4 + 4x5 - 3x6 = - 1
lox,
+ 15x6 = 5
8x4 + 4x, + 18x6 = 6
y se obtuvo
Este resultado se puede escribir en forma vectorial como
-
3r - 4s - 2t
que es la solución general de (4). Al comparar con (3), el vector
es una solución particular de (4) y
(4)
:I
5.5 Espacio rengldn, espacio columna y espacio nulo / 31 1
I-
-
3
-
-
-2
O
1
O
O
O
x=r
”
r-4
+
O-
-2
S
1
+t
O
O
O1
”
-
es la solución general del sistema homogéneo
(comprobar). A
BASES PARA
ESPACIOS
RENGL~N,
ESPACIOS
COLUMNA Y
ESPACIOS
NULOS
Primero se designaron las operaciones elementales en los renglones para resolver
sistemas lineales y, por
ese
trabajo.
sabe
se
que al efectuar una
operación
elemental en los renglones de una matriz aumentada no cambia el conjunto solución dei sistema lineal correspondiente. Se
concluye que realizar una operación
elemental en los renglones de una matriz A no modificael conjunto solucióndel
sistema lineal correspondiente A x = O o, expresado de otra forma, no cambia el
espacio nulo de A . Así, se tiene el siguiente teorema.
1
Teorema 5.5.3. Las operaciones elementales en los rengr,:nes no camhrrrn el
espacio nulo de una matriz.
Ejemplo 4 Encontrar una base para el espacio nulo de
-iJ -;-p -:]
2
A = [
Solución.
o
2 - 1
1
El espacio nulo de A es el espacio solución del sistema homogéneo
2x,
”
+ 2x2 -
X] -
x1
+
x2
x3
+ 2x,
- 3x4
x* - 2x,
x3
+x,
=o
+
=0
.xg
-xg
+
x4
=o
+ xg = o
En el ejemplo 10 de la sección 5.4 se demostró que los vectores
3 12 i Espacios vectoriales generales
1 I-1
v, =
1
O
O
O
-1
O
-1
O
1
forman una base para este espacio. A
El siguiente teorema es el correlativo del teorema 5.5.3.
Teorema 5.5.4. Las operaciones elementales en los renglones no cambian el
espacio renglón de una matriz.
A son r l ,
Demostración. Supóngase que los vectores renglón de una matriz
r2, . . . , rm y sea B la matriz que se obtiene al efectuar una operación elemental en los renglones de A . Se demostrará que todo vector en el espacio renglón
de R también está en el espacio renglón de A y recíprocamente, que todo vector en
el espacio renglón de A está en el espacio renglón de B. Esposible concluir
entonces que A y B tienen el mismo espacio renglón.
Considerar las posibilidades: Si la operación en los renglones es un
intercambio de renglones, entonces B y A tienen los mismos vectores renglón y, en
consecuencia, tienen el mismo espacio renglón. Si la operación en los renglones es
la multiplicación de un renglón por un escalar diferente de cero o es la adición de
un múltiplo de un renglón a otro renglón, entonces los vectores renglón
q,r2 ,..., rk de B son combinaciones lineales de rl, r2, . . . , rmj así, están en el
espacio renglón de A. Como un espacio vectorial es cerrado baJo la adición y la
multiplicación escalar, todas las combinaciones lineales de ri, r;, ..., rh también
están en el espacio renglón de A . Por consiguiente, todovector en el espacio
renglón de B está en el espacio renglón de A.
Como B se obtiene a partir de A al efectuar una operación en los renglones,
A se puede obtener de B al efectuar la operación inversa (sección 1.5). Así, el
razonamiento anterior muestra que el espacio renglón de A está contenido en
el espacio renglón de B. 0
e
1
En vista de los teoremas 5.5.3 y 5.5.4 se podría anticipar que las operaciones
elementales en los renglones no deben cambiar el espacio columna de una matriz.
Sin embargo, esto no es así: las operaciones elementales en los renglones pueden
modificar el espacio columna. Por ejemplo, considérese la matriz
La segunda columna es un mliltiplo escalar de la primera, de modo que el espacio
columna de A consta de todos los múltiplos escalares del primer vector columna.
Sin embargo, si se suma -2 veces el primer renglón de A al segundo renglón, se
obtiene
5.5 Espacio renglón, espacio columna y espacio nulo
i
313
Aquí nuevamente la segunda columna es un múltiplo escalar de la primera, de
modo que el espacio columna de B consta detodos los múltiplos escalares del
primer vector columna. Este espacio columna no es el mismo que elespacio
columna de A .
Aunque las operaciones elementales en los renglones pueden cambiar el
espacio columna de una matriz, se demostrará que no importa cuáles sean las
relaciones de independencia o dependencia lineal existentes entre losvectores
columna antes de la ejecución de una operación en los renglones. esas relaciones
también se cumplen para las columnas correspondientes de la matriz que se obtiene al realizar esa operación. Para precisar más este hecho, supóngase que una
matriz B se obtiene al efectuar una operación elemental en
los renglones de
una matrizA m x n. Por el teorema 5.5.3, los dos sistemas lineales homogéneos
A x = O y Bx=O
tienen el mismo conjunto solución. Así, el primer sistema tiene una solución no
trivial si y sólo si lo mismo secumple para el segundo sistema. Pero si los vectores
columna de A y B, respectivamente, son
C],
c2,.
..
9
cn
I
,
c1, c2,.
Y
. . , c:,
entonces por (2) ambos sistemas se pueden volvera escribir como
X,Cl
+ x2c2 +
xlc;
+ x2c; +
Y
o
'
.
'
+X$,
=
'
.
'
+X$:,
=o
Así, (5) tiene una solución no trivial para xl, x*, . . . , x, si y sólo si lo mismo es
cierto para ( 6 ) . Esto indica que los vectores columna de A son linealmente independientes si y sólo si lo mismo es cierto para B. Aunque se omitirá la demostración, esta conclusión también es d i d a para cualquier subconjunto de los vectores
columna. Así, se tiene el siguiente resultado.
Teorema 5.5.5. Si A y B son matrices equivalentes por renglones,entonces
a ) Un conjunto dado de vectores columna de A es linealmente independiente si
y sólo si los vectores columna correspondientes de B son linealmente independientes.
b ) Un conjunto dado de vectores columna de A forma una base parael espacio
columna de A si y sólo si los vectores columna correspondientes de B forman una base para el espacio columna de B.
El siguiente teorema hace posible encontrar por inspección bases para lps
espacios renglón y columna de una matriz en forma escalonada.
314
Espaciosvectorialesgenerales
r
i Teorema 5.5.6. S
i una
matriz R esfh en ,forma escalonada.entonces los
vectoresrenglón con los unos prixipales (rs decir, k m vectnres rengkbc;
dferentes de cero) forman una base para el espaciorenglón de N, y L L Y
vectores columna con los unos principales de ios vectores renglón forman u m
base para el espacio columna de R.
Como este resultado es casi evidente cuando se consideran ejemplos numkricos. se
omitirá la demostración; Csta requiere algo más que el análisis de las posiciones de
los ceros y los unos de R.
Ejemplo 5 La matriz
R=
I
O
.7
o
o
O
O
l
está escrita en forma escalonada. Por el teorema 5.5.6. los vectores
fi
.=[!
-2
o 31
5
‘?=[o
1 3
o
01
rj = 0
o o
I
O
forman una base para el espacio renglbn de R, y los vectores
forman una base para el espacio columna de R . A
Ejemplo 6 Encontrar bases para los espacios renglón y columna de
1
A=
2
2
-1
-3
-4
-6
3
4
9
9
--4
-2
-1
-1
2
4
5
S
2
9
7
-- 5 -. 4
Solución. Como las operaciones elementales en los renglones no cambian el
espacio renglón de una matriz, es posible hallar una base para el espacio renglón
5.5 Espacio renglón, espacio columna y espacio nulo
1 315
de A determinando una base para el espacio renglón de cualquier forma escalonada de A. ReduciendoA a forma escalonada se obtiene(comprobar)
Por el teorema 5.5.6, los vectores renglón diferentes de cero de R forman una base
para el espacio renglón de R y, por tanto, forman una base para el espacio renglón
de A. Estos vectores básicos son
',=[I
r,=[O
r,=[O
-2 5 41
O 1 3 -2
-61
O O O 1 51
-3
4
Teniendo en cuenta que A y R pueden tener espacios columna diferentes, no
es posible encontrar una base para el espacio columna de A directamente a partir
de los vectores columna de R. Sin embargo, por el teorema 5.5.56 se concluye que
si se puede hallar un conjunto de vectores columna de R que formen una base para
el espacio columna de R, entonces los vectores columna correspondientes de A
formarán una base para el espacio columna de A .
Las columnas primera, tercera y quinta de R contienen los unos principales
de los vectores renglón, de modo que
forman una base para el espacio columna de R; así, los vectores columna correspondientes de A , a saber
c, =
[ 11,
-1
j],
%=[ -4
[; I]
-5
forman una base para el espacio columna de A . A
Ejemplo 7 Encontrar una base para el espacio generado por los vectores
316
Espacios vectoriales generales
~ , = ( 2 ,-5, -3, - 2 , 6 ) ,v 3 = ( 0 , 5 ,
v4 = (2, 6, 18, 8, 6 )
vI=(1, -2,0,0,3),
15, l O , O ) ,
Salvo por una variación en la notación, el espacio generado por estos
vectores es el espacio renglón de la matriz
Solución.
1 - 2
o
2 -5
-3
O
5
15
2
6 1 8
o
3
6
-2
10
8
Ó
6
Reduciendo esta matriz a la forma escalonada se obtiene
I
1
-- 2
O
0
O
O
O
1
_J
O
Los vectores renglón diferentes de cero en esta matriz son
WI
= ( l , -2,0,0,3),
w 3 = ( 0 , O , 1, 1,O)
w,=(O, 1 , 3 , 2 , 0 ) ,
Estos vectores forman una base para el espacio renglón y por tanto forman
una base para el subespacio de R5generado por vl, v2, v3 y v4. A
Obsérvese que en el ejemplo 6 los vectores básicos obtenidos para el espacio
columna de A consistían en los vectores columna de A , pero los vectores básicos
obtenidos para el espacio renglón de A no eran todos los vectores renglón de A . El
siguiente ejemplo ilustra un procedimiento para encontrar una base del espacio
renglón de unamatriz A que consta completamente de vectoresrenglón de A .
Ejemplo 8 Encontrar una base para el espacio renglón de
-;y; ;
-2
A = [
o
o
;]
que conste completamente de vectores renglón de A .
Solución. Se transpondrá A , convirtiendo así el espacio renglón de A en el
espacio columna de AT; luego se aplicará el método del ejemplo 6 para encontrar
una base del espacio columna de AT; y luego se transpondrá nuevamente a fin de
convertir los vectores columna de nuevo en vectores renglón. Al transponer A se
obtiene
5.5 Espacio renglón, espacio columna y espacio nulo / 31 7
I
1
2
-5
O
5
O
-3
-2
6
15
-2
AT=
o
3
2
6
18
8
6
10
O
Reduciendo esta matriz a forma escalonada se obtiene
O
-5
O
O
O
'-;I
-
I;]O
O
Las columnas primera, segunda y cuarta contienen los unos principales, de modo
que los vectores columna correspondientes en AT forman una base para el espacio
columna de AT; éstos son
c,
=
O
i
-2
Y
3
Transponiendo denuevoy
vectores básicos
rl = [ 1
c ~ = l2 i ]
ajustando correctamente la notación se obtienen los
O
O 31,
r2=[2
-5
-3
-2
61,
Y
r4=[2
6
18 8 6 1
para el espacio renglón de A . A
Por el teorema 5.5.5 se sabe que las operaciones elementales en los renglones no modifican las relaciones de independencia lineal o dependencia lineal entre
los vectores columna; sin embargo, las fórmulas (5) y (6) indican un resultado
incluso más profundo. Debido a que estas fórmulas tienen en realidad los mismos
coeficientes escalares xl, xz, . . . ,xn, se concluye quea
ls operaciones elementales
en los renglones no modifícan l a s fórmulas (combinaciones lineales) que relacionan
vectores columna linealmente dependientes.
Se omite la demostración formal.
Ejemplo 9
a) Encontrar un subconjunto de los vectores
3 IN
1
Espacios vectoriales generales
que forme una base para el espacio generado por estos vectores.
b) Expresar los vectores que no pertenecen a la base como una combinación lineal
de los vectores básicos.
Solución de u). Se empezará por construir una matriz que tenga a v l , vz, . .
como sus vectores columna:
i~
1
2
-5
O
o
-3
6
T
3
-2
3
\;
I
o
2
-1
4
-7
. , v5
5
"8
1
21
\,
\ ;
\,
\ <
La primera parte del problema se puede resolver encontrando una base para el
espacio columna de esta matriz. Al reducir la matriz a la forma escalonada y
denotar los vectores columna de la matriz resultante por wl, w2, w3, w4 y w5 se
obtiene
i:
1
2
o
o
0
0
o
0
1
O
o
1
-1
~1
1
0
Losunos principales aparecen en las columnas 1, 2 y 4, demodo que porel
teorema 5.5.6
íw,,w2>w4)
es una base para el espacio columna de (8) y en consecuencia
es una base para el espacio columna de (7)
Solución de 6). Se empezará por expresar w3 y w5 como combinaciones lineales
de los vectores básicos w,, w2, w4. La forma más sencilla de hacer lo anterior es
expresando w3 y wj en términos de los vectores básicos que tengan los subíndlces
más pequefios. Así, w3 se expresará como una combinación lineal de w1 y w2, y
5.5 Espacio rengldn, espacio columna y espacio nulo
319
w5 se expresara corno una combinación lineal de w l , w2 y w4.Por inspección de
(S), estas combinaciones lineales son
2w, - W?
wj = w , + w2 + wq
W? =
Las expresiones anteriores se denominan ecuaciones de dependencia. Las
relaciones correspondientes en ( 7 ) son
v3 =
2v,
v5 = v i
-
V?
+ v2 + vq
A
El método ilustrado en el ejemplo precedente es tan importante que a continuación se resumen los pasos:
Dado un conjunto de vectores S -- {vl, v2, . . . , vk} en R" con el s i p e n t e procedimiento se obtiene un subconjunto de estos vectores que forma una base para
lin (S) y expresa losvectoresde
S que no pertenecen a la basecomouna
combinación lineal de los vectores básicos.
Paso 1. Formar la matriz A que tiene a vl, v2, . . . , vk como sus vectores
columna.
Paso 2. Expresar la matriz A en su forma escalonada reducida R, y sean wl,
w2, . , wk los vectores columna de R.
, ,
Paso 3. Identificar las columnas que contienen a los unos principales en R. Los
vectores columna correspondientes de A son los vectores básicos para
lin (S).
Paso 4. Expresar cada vector columna de R que no contenga un uno principal
comocombinación lineal delosvectores
columna precedentes que
contengan unos principales. (Esto se puede hacer por inspección.) Así,
se obtiene un conjunto de ecuaciones de dependencia que incluyen a
los vectores columna de R. Las ecuaciones correspondientes para los
vectores columna de A expresan los vectores que no pertenecen a la
base comocombinaciones lineales de los vectores básicos.
EJERCICIOS DE LA SECCIÓN 5.5
1. Enumerar los vectores renglón y los vectores columna de l a matnz
Espacios vectoriales generales
320
2. Expresar el producto Ax como una combinación lineal de los vectores c o l m m de A
3. Determinar si b está en el espacio columna de A y, en caso afirmativo, expresar b como
ma combinación lineal de loa vectores columna de A .
4. Supóngase que x, = - 1, x 2 = 2 , x 3 = 4 , x4 = -3 es una solución de un sistema lineal no
homogeneo Ax = b, y que elconjunto solución delsistema homogéneo Ax = O está
definido por las fórmulas
x, = - 3 r + 4s-
x? =
r
x, = r,
- S,
x4
=S
a) Encontrar la forma vectorial de la solución general de Ax = O .
b) Encontrar la fonna vectorial de la solución general de Ax = b.
5. Encontrar la forma vectorial de la solución general del sistema lineal dado A x = b; luego,
usar el resultado para encontrar la forma vectorial de la solución general de Ax = O.
a) x I - 3x, = 1
b) x 1 x, 2x, = 5
+ +
2 x I - 6x2 = 2
XI
2x,
C)
+
+
+
+
+
.xI - 2 ~ , X , + 2 x 4 = - 1
2xI - 4x,
2x3 4x, = -2
-x,
2x, - x3 - 2x4 =
1
3x, - 6x, 3x3 6x4 = - 3
+
+ x, = - 2
+ x, + 3x, = 3
.xI
d)
-2x,
-x1
4x,
+ 2x, 3x3 + x4 = 4
+ x, +2x, + x, = - 1
+ 3x, x3 + 2x, = 3
-
-
-
6. Encontrar una base para el espacio nulo deA .
-1
0
-
lx,
- 5x4 = -5
5.5 Espacio renglón, espacio columna y espacio nulo / 321
7. En cada inciso se proporciona una matriz en forma escalonada. Por inspección, Rallar las
bases de los espacios renglón y columna deA .
c)
1
2
4
O
0
0
O
0
0
[: A -;
- :I [" ' :]
5
1
d)
O
O
0
-7
0
8. Para las matnces del ejercicio 6, encontrar una base para el espacio renglón de A redu-
ciendo la matnz a la forma escalonada.
9. Para las matnces del ejercicio 6, encontrar unabase para el espacio columna deA .
10. Para las matrices del ejercicio 6, encontrar una base para el espacio renglón de
A que
conste completamente de vectores renglón A
de.
11. Encontrar unabase para el subespacio de I? generado por los vectores dados.
a) (1, 1, -4, -31, (2, O, 2,-21, (2, - 1, 3,2)
(b) ( - 1,1, -2, O), (3,3, 6, O), (9, 0,0,
c) (1, 1, o, O), (0, o, 1, 11, (-2, o, 2,2), (O, -3, o, 3)
12. Determinar un subconjunto de los vectoresque formen una base para el espacio generado
por los vectores; luego, expresar cada vector que no pertenezca a la base como una combinación lineal de los vectores básicos.
a)vl=(l,O,l,l), v,=(-3,3,7,1), v,=(-1,3,9,3), v4=(-5,3,5,
-1)
b)v,=(1,-2,0,3), ~,=(2,-4,0,6), v3=(-1,1,2,0), ~,=(O,-l,2,3)
~ ) ~ 1 = ( 1 , - 1 , 5 , 2 )~,, = ( - 2 , 3 , 1 , 0 ) , ~ , = ( 4 , - 5 , 9 , 4 ) , ~ , = ( 0 , 4 , 2 , - 3 ) , ~ , = ( - 7 , 1 8 , 2 , - 8 )
13. Demostrar que los vectores renglónde una mabiz invertible A n X n fomm una base para R".
14. a) Sea
A=[!
i]
y considérese un sistema de coordenadas rectangulares xyz en el espacio tndimensional.
Demostrar que el espacio nulo de A consta de todos los puntos del eje z y que el espacio
columna constade todos los puntos enel plano v.
t1 '
Espacio nulo de A
Y
3)
5.6 RANGO Y N
LQS CUATRO
ESPACIOS
MATRIClALES
FUNDAMENTALES
Si se consideran juntas una matriz A y su transpuesta
espacios vectoriales de intcrds:
espacio renglón de A
espacio colunlna de '4
espacio nulo de .4
A': entonces existen seis
espacio renglón deA T
espacio columna de AT
espacio nulo de A'
Sin embargo, al transponer una matriz sus vectores renglón se convierten en vcctores columna y sus vectores columna se convierten en vectores renglón, de modo
quc, exceptoporuna diferencia en la notación,el espacio renglón de A T es el
mismo que el espacio columna de A, y el espacio columna de AT es el mismo que
el espacio renglón de "l. Así, quedan cuatro espacios vectoriales de interés:
espacio renglón de A
espacio nulo de A
espacio columna de A
espacio nulo de Ai'
Estos se denominan espacios matriciales fundamentales asociados con A . S i A es
una matraz 171 X n. entonces el espacio renglón de A y el espacio nulo de A son
subespdcios de R" y el espacio columna dc A y cl espacio nulo de AT son subespacios dc Km. El objetivo principal en esta sección es establecer las relaciones
que hay entre las dimensiones de estos cuatro espacios vectoriales.
EL ESPACIO
RENGLóN Y EL
ESPACIO
COLUMNA
TIENEN LA
MISMA
DIMENSI~N
En el ejemplo 6 de la seccibn 5.5 se encontró que el espacio renglón y el espacio
columna de la matriy
5.6 Rango y nulidad / 323
tienen, cada uno, tres vectores; es decir, ambos espacios son tridimensionales. NO
es fortuito que estas dimensiones sean iguales; es una consecuencia del siguiente
resultado general.
Teorema 5.6.1. Si A es cualquiermatriz,entonces
espacio columna de A tienen la misma dimensión.
Demostracion.
deduce que
el espacio renglón y el
Sea R la farma escalonada reducida de A.Por el teorema 5.5.4 se
dim(espacio renglón de A)= dim(espacio renglón de R )
y, por el teorema 5 . 5 3 4 se concluyeque
dim(espacio columna de A) = dim(espacio columna de R )
Así, la demostración estará completa si se puede probar que el espacio renglón y el
espacio columna de R tienen la misma dimensión. Pero la dimensión del espacio
renglón de R es el número de vectores Merentes de cero y la dimensión del espacio columna de R es el número de columnas que contienen unos principales (teorema 5.5.6). Sin embargo, los renglones diferentes de cero son precisamente los
renglones en que aparecen los unos principales, de modo que el número de éstos y
el número de renglones diferentes de cero es el mismo. Esto demuestra que el espacio renglón y el espacio columna de R tienen la misma dimensión. 0
Las dmensiones de los espacios renglón, columna y nulo de una matriz son números tan importantes que existen notación y terminología especiales asociadas con
ellos.
RANGO Y
NULIDAD
Definición. La &mensión común del espacio renglón y del espacio columna de
una matriz A se denomina rango de A y se denota por rango@); la dimensión
del espacio nulo de A se denomina nulidad de A y se denota por nulidad(A).
Ejemplo 1 Encontrar el rango y la nulidad de la matriz
r-l
o
14
2
"9
-4
-4
Soluciói:. La forma escalonada reducida de A es
1
O
O
1
O
0
0
O
0
0
-4
-2
-28
-12
O
O
-37
-16
O
O
-:I
71
324
Espacios vectoriales generales
(comprobar). Como existen dos renglones diferentes de cero (o, equivalentemente.
dos unos principales), el espacio renglón y el espacio columna, ambos, son bidimensionales, demodo que rango(A) = 2. Para encontrar la nulidad de A es
necesario determinar la dimensión del espacio solución del sistema lineal A x = O .
Este sistema se puederesolver expresando la matriz aumentada en la forma
escalonada reducida. L,a matriz resultante es idéntica a (l), excepto que contiene
una liltima columna adicional de ceros
y el sistema de ecuaciones
correspondente es
x, - 4x, 28x, 37x, + 13x, = o
x2 - 2x3 - 12x4 - 16x5 + 5x6 = O
"
-
o bien, despejando las variables principales,
+
,y2 = 2x3 + 12x4 i
.Y,
=
4 ~ , 28x4 + 37x5 - I ~ x ,
16x5- 5x6
Se concluyeque la solución general del sistema es
+ 28s + 37t
x2 = 2r + 12s + 16t
X, =
"€3
=
4r
-
1 3 ~
-
5u
Y
x4 = S
X$
=
t
X6
=
u
o bien, de manera equivalente,
+ S
28
12
O
1
37
t l
O
O
O
O
1
O
-1
-
16
+U
13
O1
Los cuatro vectores del miembro derecho de (3) forman una base para el espacio
solución. de modo que nulidad(A) = 4. A
El siguiente teorema muestra que una matriz y su transpuesta tienen el
mismo rango.
I Teorema
5.6.2. Si A es cualquier matriz, entonces rango@) = rango(AT).
I
Demostración.
rango(A) = dim(espacio renglón de A )
SOCAT>.
o
=
dm(espacio columna de A T ) = ran-
-
5.6 Rango y nulidad / 325
El siguiente teorema establece una relación importante entre el rango y la
nulidad de una matriz
Teorema 5.6.3. (Teorema de la dimensión para matrices). Si A es una matriz
con n columnas, entonces
TEOREMA DE LA
DIMENSI~N
rungo ( A )
I
+ nulidad ( A ) = n
Demostración. Como A tiene n columnas, el sistema lineal homogéneo A x = O
tiene n incógnitas (variables), que se clasifican en dos categorías: principales y
libres.
Asl.
número de variables
principales
variables libres
Pero el número de variables principales es elmismo que el número deunos
principales en laforma escalonada reducida deA , que es el rango de A . Por tanto,
número de
libres
1
El número de variables libres es igual a la nulidad de A . Esto es así porque la
nulidad de A es la dimensión del espacio solución de A x = O, que es igual al
número de parámetros que hay en la solución general véase (3), por ejemplo , que
es igual al número de variables libres. Así,
rango ( A ) + nulidad ( A ) = n
0
La demostración del teorema precedente contiene dos resultados importantes
de suyo.
Teorema 5.6.4. Si A es una matriz n X n, entonces:
a) Rango(A)= Número de variables principales que hay en la solución de A s
=
o.
b ) Nulidad(A) = Nzimero de parúmeíros que hay en la solución de As = O .
.726
,/'
Espacios vectorides genernics
Ejemplo 2 La matriz
-1
'4 =
-
2
3 - 7
2 - 5
4 -9
O
2
2
2
4
5 - 3
1
4
o
4
"4
6
"4
1
7
tiene seis columnas, de modo que
rango@) + nulidad@) = 6
Lo anterior es consistente con el ejemplo 1, donde se demostró que rango(A) = 2 y
nulidad@) = 4. A
Ejemplo 3 Encontrar el número de parámetros que hay en el conjunto solución de
A x = O siA es una matriz 5 x 7 de rango 3 .
nulidad(A) = n - rango(A) = 7 - 3 = 4
Así, existen cuatro parámetros. A
Ahora supóngase que A es una matriz m X n de rango r ; por el teorema
X m de rango r . Aplicando el teore-
5.5.2 se concluye que A T 'es una matriz n
ma 5.6.3 a A y
se obtiene
A
'
nulidad@) = n - r , nulidad(AT)= m - r
a partir de lo cual se deducela siguiente tabla que relaciona las dmensiones de los
cuatro espacios fundamentales de una matriz A de rango r.
(Espacioental
I Espacio renglón d e n
VALOR MÁXIMO
PARA EL RANGO
Dimensión
I
r
I
Si A es una matriz m x n, entonces los vectores renglón están en R" y los vectores
columna están en Rm. Esto signrfica que el espacio renglón de A es cuando mucho
de hmensión n y que el espacio columna de A es cuando mucho de dimensión m.
Como los espacios renglón y columna tiene la m i s m a dimensión (el rango de A ) ,
se debe concluir que si m = n, entonces el rango de A es menor o igual al mínimo
de m y n. Este hecho se indica escribiendo
5.6 Uav1go y nulidad
rango 04) 5 nlín ( m ,n )
1'
327
(5)
donde mín(m. n ) denota el menor de los números m y n si m
si m = 11.
f
n o su valor coniún
Ejemplo 4 Si A es una matriz 7 x 4, entonces el rango de A es menor o igual que
4 y, en consecuencia, los siete vectores renglón deben ser
linealmente
dependientes. Si A es una matriz 4 X 7, entonces nuevamente el rango de A es
menor o igual que 4 y. por tanto, 10s siete vectores columna deben ser linealmente
dependientes.
A
SISTEMAS
LINEALES DE m
ECUACIONES
CON n
LNC~GNITAS
En secciones anteriores se obtuvo unaampliagamadeteoremas
relacionados con
sistemas lineales de n ecuaciones con n incógnitas (véase el teorema 4.3.4). Ahora
la atención se dirigirá a sistemas lineales de m ecuaciones cn n incógnitas en los
cuales m y n no necesariamente SQII iguales.
El siguiente teorema establece condiciones en las que segarantiza que un sistema lineal de w z ecuaciones con n incógnitas es consistente.
Demostración. Basta demostrar las equivalencias
ces por lógica se concluye que a e c.
a
9
ae
hy b
9
c. ya que enton-
h . Véase el teorema 5.5.1
h e c. Se demostrar5 que si b a t á en el espacio columna de A , entonces los
espacios columna de A y de [..I ' b] son iguales en realidad, a partir de lo cual se
concluir6 que estas dos matrices tienen el mismo rango.
Por definición. el espacio columna de una matriz es el espacio generado por
sus vectores columna,de modo que los espacios columnade A y de 1
'
4 I b l se
pueden expresar c0m0
Generado { c, , c2, . . . , c, }
y
generado ( c ,, c2, . . . , c,, b }
respectivamente. Si b está en el espacio columna de A , entonces cada vector
en el conjunto {cl, c2, . . , c,, b } es una combinación lineal de los vectores en
{c,, c2, . . . , c n } y recíprocamente (¿por qué?). Así, por, el teorema 5.2.4, el espacio columna de A y el espacio columna de [A ! b] son iguales.
,
328
1
Espacios vectoriales generales
b Supóngase que A y [A b] tienen elmismo rango Y . Por el teorema 5.4.4,
existe algún subconjunto de los vectores columna de A que forman una base para
el espacio columna de A . Supóngase que estos vectorescolumna son
c
I
I
. ’ , c:
C ] I c2,.
Estos Y vectores básicos también pertenecen al espacio columna de dimensión r de
[A I b]; por tanto, según el teorema 5.4.6a, también forman una base para el
espacio columna de [A b]. Esto significa que b se puede expresar como una
combinación lineal de ci,ci,... ,c; , y, en consecuencia, b está en el espacio
columna de A . 0
No es dificil imaginar por qué este teorema es verdadero si el rango de una
matriz se considera como el número de renglones diferentes de cero que hay en su
forma escalonada reducida. Por ejemplo, la matriz aumentada del sistema
+ 2x4 = - 4
x, - 2x, - 3x,
-3X,
+7X2-
2x, - 5x2
- 3x,
-3
X,+
X,=
+ 4x,
- 3x, =
7
+ 6x2 + 9x3 - 6x4 = - 1
es
I
1
- -2
-3
2
-3
- .S
-3
--1
4
6
9
2
-
7
1
--3
--6
I:J
- 17
que tiene la siguiente forma escalonada reducida (comprobar):
10
O
O
O i O
Debido al renglón
0
0
0
0
1
se observa que el sistema es inconsistente. Sin embargo, también es debido a este
renglón que la forma escalonada reducida de la matriz aumentada tiene menos
renglones cero que la forma escalonada reducida de la matriz de coeficientes. Esto
hace que la matriz de coeficientes y la matriz aumentada del sistema tengan rangos distintos.
Ei teorema de consistencia trata sobre las condiciones en las cuales un sistema lineal Ax = b es consistente para un vector espedfico b. El siguiente teorema tiene que ver con las condiciones en que un sistema lineal es consistente para
todas las elecciones posibles de b.
5.6 Rango y nulidad / 329
Teorema 5.6.6. Si A x = b es un sistema lineal de m ecuaciones Con n incognitas, entonces lassiguientes proposiciones son equivalentes.
a ) A x = b es consistente para toda matriz b m X 1.
b ) Los vectores columna de A generan a R".
c) rango(A) = m .
Demostración. Basta probar las equivalencias a
por lógica se concluye que b e c.
* b y a * c, ya que entonces
a e b. Por la fórmula (2) de la sección 5.5, el sistema A x
como
X,C,
+ x2c2 + . . . + X,C,
=
b se puede expresar
=b
del cual se concluye que A x = b es consistente para toda matriz b m X 1 si y sólo
si b se puede expresar como una combinación lineal de los vectores columna cl,
c2, . . . , c, o, equivalentemente, si y sólo si estos vectores columna generan a Rm.
a e c Por la hipótesis de que A x = b es consistente para toda matriz b m X 1, y
por los incisos a ) y b ) del teorema de consistencia (teorema 5.6.5), se concluyeque
todo vector b en R" está en el espacio columna de A ; es decir, el espacio columna
de A es todo R". Así, rango(A) = dim(R'") = m.
c e a Por la hipótesis de que rango(A) = m, se concluyeque el espacio columna de
A es un subespacio de R" de dlmensión m, y debido al inciso 6 ) del teorema 5.4.7,
debe ser todo R". Ahora, porlos incisos a ) y 6 ) del teorema de consistencia
(teorema 5.6.5) se concluye que A x = b es consistente para todo vector b en Rm ,
ya que b está en el espacio columna de A . [7
Se dice que un sistema lineal con másecuaciones que incógnitas es un
sistema lineal sobredeterminado. Si Ax = b es un sistema lineal sobredeterminado
de m ecuaciones con n incógnitas (de modo que m > n), entonces losvectores
columna de A nopueden generar a R" (¿por qué?); por el último teoremase
concluye que un sistema lineal sobredeterminado A x = b no puede ser consistente
para ningún b posible.
Ejemplo 5 El sistema lineal
x1 - 2x2 = b,
x2 = b,
x, + x2 = b,
x, + 2x2 = b,
x1 + 3x2 = b,
XI -
es sobredeterminado, de modo que no puede ser
consistente para ninguno de IPS
valores posibles de h , , h, b,, 5, y b,. La resolucióndel sistema lineal por
climinación deGauss-Jordan da las condiciones exactas en que el sistema cs
consistente. Se deja para el lector demostrar que la roma escalonada reducida rle
l a matriz aurncntada es
(1
Entonces, el sistema es consistente s i y sólo si hi. h,
condiciones
7_h! - 3h2 -5
3 h , -- 4h2
4b, - 5h2
h,
b,. h, y h , satisfacen las
-0
-C
b,%
o
~=
+ h, = li
o bien, resolviendo este sistema lineal hornogdnco,
donde Y y S son arbitrarios
A
En la fórmula (3) del teorema 5 5.2, 10s escalares c I , c2. . . . ck son
parámetros cualesquiera presentes en las soluciones generales dc A x = h y de A H =
O. Así, estos dos sistemas tienen el mismo número de parámetros en stus soluciones
generales. Además, por el inciso h ) del teorema 5.6.4 se concluye que el nimero
de tales parámetros es nulidad(A). Este hecho y el teorema de l a dimensión para
matrices (teorema 5.6.3) conducen a! siguiente teorema.
En secciones anteriores se obtuvo una amplia gama de condiciones
en
las que se garantiza que un sistema lineal homogknel: A H = O de n ecuacioncs
con n incógnitas sólo tiene la solución trivial (véase el teorema 4.3.4.j Con el
siguiente teorema se obtienen algunos resultados correspondientes para sistemas de ecuaciones de m ecuacioraes con p? incógnitas. donde m y n pueden ser
diferentes
5.6 Rango y nulidad / 331
Teorema 5.6.8. Si A es una matriz m X n, entonces las siguientes prOpOSiCi0nes son equivalentes.
a ) A x = O sólo tiene la solución trivial.
b ) Los vectores columna de A son linealmente independientes.
c) A x = b tiene cuando mucho una solución (ninguna o una) para toda matriz
bmxl.
Demostración. Basta probar las equivalencias a
por lógica se concluye que b e.c.
0
b y a e c, ya que entonces
a e b. Si cl, c2, . . . , c, son los vectores columna de A, entonces el sistema lineal
A x = O se puede escribir como
X,C,
+ x*c2 +
' ' '
+
X$,,
=
o
(6)
Si cl, c2, . . . , c, son linealmente independientes, entonces la ecuación anterior se
cumple sólo para x1 = x2 = . . . = xn = O, lo cual sigmfica que A x = O sólo tiene la
solución trivial. Recíprocamente, si A x = O sólo tiene la solución trivial, entonces
(6) se cumple sólo para x1 = x2 =
= x, = O, lo cual significa que cl, c2, . . . , cn
son linealmente independientes.
' '
'
a e c. Supóngase que A x = O sólo tiene la solución trivial. Ax = b es consistente o
no lo es. En caso de que no sea consistente, no existen soluciones de A x = b y ya se
ha terminado. Si Ax = b es consistente, sea x. cualquier solución. Por la
observación enunciada después del teorema 5.5.2 y el hecho de que A x = O sólo
tiene la solución trivial, se concluye que la solución general de A x = b es x. + O =
xo.Así, la única solución deA x = b es x,,.
Supóngaseque A x = b tienecuandomucho una soluciónpara toda
matriz b m X 1. Entonces, en particular Ax = O tiene cuando mucho una solución.
Así, A x = O sólo tiene la solución trivial. 0
c e a.
Un sistema lineal con más incógnitas que ecuaciones se denomina sistema
fineafsubdeterminado. Si Ax = b es un sistema lineal subdeterminado consistente
de m ecuaciones con n incógnitas (de modo que m < n), entonces por el teorema
5.6.7 se concluye que la solución general tiene por lo menos un parámetro (¿por
qué?); por tanto, un sistema lineal subdeterminado consistente debe tener inJnidad de soluciones. Además, si A x = b es cualquier sistema lineal subdeteminado,
entonces los vectores columna de A no pueden ser linealmente independientes (¿por
qué?); por el teorema5.6.3 se concluye quepara un sistema lineal subdeterminado Ax
= b existe alguna b para la cual el sistema tiene infinidad de soluciones.
OBSERVACI~N. Por el teorema 5.6.3 también se concluye que un sistema lineal
homogéneo subdeterminado tiene infinidad de soluciones; aunque este hecho ya se
demostró en el capítulo 1 (teorema 1.2.1).
332
,/
Espacios vectoriales generales
Ejemplo 7 SiA es una matriz 5 x 7, entonces para toda matriz b 7 x 1 el sistema
lineal Ax = b es subdeterminado. Así, A x = b debe ser consistente para alguna b, y
para toda b asi la solución general debe tener 7 - r parámetros, donde r es el
rango de A. A
RESUMEN
En el teorema 4.3.4 se enumeraron ocho resultados que son equivalentes a la
invertibilidad de una matriz A. Esta sección concluye agregando ocho resultados
más a la lista, a fin de obtener el siguiente teorema que relaciona los temas principales que se han estudiado hasta el momento.
Teorema 5.6.9. Si A es una matriz n x n, y si TA:Rn+ R" es la multiplicación
por A , entonces lassiguientes proposiciones son equivalentes.
a ) A es invertible.
b ) Ax = O sdlo tiene la solución trivial.
c) La forma escalonada reducida de A es 1,.
d, A se puede escribir corno un producto de matrices elementales.
e ) A x = b es consistente para toda matriz b n X l .
fi A x = b tiene exactamente una solución para toda matriz b n x l .
g>det(A) f O .
h) El rango de Zp, es Rn.
I) TA es unoa uno.
j ) Los vectores columna de A son linealmente independientes.
k ) Los vectores renglón de A son linealmente independientes.
0 Los vectores columna de A generan a R".
m ) Los vectoresrenglón de A generan a R".
n ) Los vectores columna de A forman una base para R".
o> Los vectores renglón de A ,forman una base para R".
p ) El rango de A es n.
q) La nulidad de A es O .
Demostración. Por el teorema 4.3.4, se sabe que las proposiciones de la a) a la i )
son equivalentes. Para completar la demostración se probará que las proposiciones
de l a j ) a la q) son equivalentes a h), al demostrar la sucesión de implicaciones b
*j*k*l*m*n*o*p*q*b.
b * j . Si A x = O sólo tiene la solución trivial, entonces por el teorema 5.6.8 los
vectores columna de A son linealmente independientes.
j * k * 1 * m * n * o. Esto se concluye por el teorema 5.4.5 y el hecho de que
R" es un espacio vectorial de dimensión n. (Los detalles se dejan como ejercicio.)
o
* p . Si los n vectores renglón de A forman una base para R", entonces el espacio
renglón de A es de dimensión n y el rango de A es n.
p
* q. Este hecho se concluye por elteorema de la dimensión (teorema 5.6.3).
5.6 Rango y nulidad / 333
q
b. Si la nulidad de A es O, entonces el espacio solución de Ax = O tiene
dimensión O , lo cual significa que sólo contiene al vector cero. Por tanto, Ax = O
sólo tiene la solución trivial. 0
EJERCICIOS DE LA SECCIÓY 5.6
1. Comprobar que rango(A) = rango(AT).
1
Id -!I
2. Encontrar el rango y la nulidad de la matriz;luego,comprobar
obtenidos satisfacen la fórmula (4) del teorema de la dimensión.
a) A = [ !
d) A
=
1
4
3 - 2
-1
2
o
3
-a]
o
-1
b) A = [ :
5
1
-1
5
6
4
que los valores
1
-1
,-I
3
2
3
6
O
-3
9
2- 5 - 4
-3
-2
7
-2
5
2
2 1 3 , ]
c)A=
1
o
4
2
'1
3. En cada inciso del ejercicio (2), usar los resultados obtenidos para encontrar el número
de variables principales y el número de parámetros que hay en la solución de Ax = O
sin resolver el sistema.
4. En cada inciso, usar la información que se proporciona en la tabla para encontrar la
dimensión del espacio renglón de A, del espacio columna de A, del espacio nulo de A y
del espacio nulo de AT.
-
a)
TamañodeA
Rango de A
3
C
b)
2
1
e)
2
9 x 5
2
d)
0
8)
5 x 9 6 x32x 3
O
2
4 x3 4x 3
5. En cada inciso, encontrar el valor máximo posiblepara el rango de A y el valor mínimo
posible para la nulidad de A.
a) A es 4 X 4.
b)Aes3
X
5.
c) A es 5
X
3.
6. Si A es una matriz m X n, ¿cuál es el valor máximo posible para su rango y cuál es el
valor mínimo posible para su nulidad? [Sugerencia. Ver el ejercicio 5.1
7. En cada inciso, usar la información que se proporciona en la tabla para determinar si el
sistema lineal Ax = b es consistente. En caso afirmativo, escribir el número de parámetros que hay en su solución general.
3 x 3
334
Espaciosvectoriales generar’es
8. Para cada una de las matrices del ejercicio 7, encontrar l a nulidad de A y determinar el
niunero de parámetros que hay en la solución general del sistema lineal homogéneo Ax
=o
9. ¿,Quk condicionesdebensatisfacer
sobredeterminado
b , , b,. b,, b, y b, paraque
el sistema lineal
3 , =~ h ;~
= h2
i- X? = 11,
- 4x2 = h,
X --
x1 - 21,
S
)
.yl
x, + 5
. =~ h,~
sea consistente‘!
10. Sea
A=
“21
“22
Demostrar que el rango de A es 2 si y sólo si uno o más de los siguientes determinantes
“2,
“21
022
‘23
“22
“23
es diferente de cero.
11. Supóngase que A es una matriz 3 X 3 cuyo espacio nulo es una recta que pasa por el
origen en el espacio tndimensional. ¿Es posible que el espacio renglón o el espacio
columna de A también sea una recta que pasa por el origen? Explicar la respuesta.
12. Analizar cómo el rango de A varía con t.
a)A=[; l
;
i
t
t
b)A=[-i
-:
3
-:]
-
13. ¿Existen valores de r y S para los cuales el rango de
[;y +]
O
o
sea uno o dos? En caso afirmativo, encontrar los valores
Ejercicios complementarios / 335
14. Supóngase que A es una matnz 3 X 3 cuyo espacio columna es un plano que pasa por
el origen en el espacio tridimensional. ¿Es posible que el espacio nulo sea un plano que
pasa por el origen? ¿Es posible que el espacio renglón sea un plano que pasa por el
origen? Explicar las respuestas.
15. a) Demostrar: Si A es una m a h z 3
X
5, entonceslos vectores columna de A son
linealmente dependientes.
b)Demostrar:Si
A es unamatriz
linealmente dependientes.
X
3 , entonces los vectores rengl6n de A son
5
16. Demostrar: Si A es una matrlz no cuadrada, entonces los vectores renglón de A o los
vectores zolumna de A son linealmentedependientes.
[Sugerencia Ver elejercicio
15.;
17. Usar el resultado del ejercicio 10 para demostrar que el conjunto de puntos (x, y , z) en
R3 para el que l a matriz
tiene rango 1 es la curva con ecuaciones paramétricas x = t, y = 3, z = t 3 .
18. Demostrar: Si k # 0, entonces A y kA tienen el mismo rango
O
-S
COMPLEMENTARIOS
1. En cada inciso, el espacio solución es un subespacio de R", por lo que debe ser una
recta que pasa por el origen, 'unplano que pasa por el origen, todo R3 o sólo el origen.
Para cada sistema, determinar cuál es el caso. Si el subespacio es un plano, encontrar
una ecuación para é1 y si es una recta, encontrar las ecuaciones paramétricas.
d) Ox + O y + Oz = O
b) 2x - 3v +- z == O
c)
x - 2y
7z = O
d) x i 4y 82 = O
6~ - 9 , ~ 32 = O
2x + Sy + 62 = O
-4~+8y+5z=O
2x - 43' 32 = o
-4xt-6.v-2z-O
3X+ y - 4 2 ~ 0
+
+
+
2. ¿Para qué valores de S el espacio solucicn de
+ sx3 = O
x, + sx2 + Xj = O
XI
SXI
+
x2
i
x2 i
xj = O
es una recta que pasa por el origen, un plano que pasa por el origen, sólo el origen o
todo R3?
- b, a + 26) como una combinación lineal de (4, 1, 1) y (O, - 1,2).
b) Expresar (3a + b + 3c, -a + 46 - c, 2a + b + 2c) como una combinación lineal de
(3, - 1 , 2 ) ~ ( 1 , 4 , 1 ) .
3. a) Expresar (4a, a
+
336 i Espacios vectoriales generales
c)Expresar (2a - h + 4c, 3a
vectores diferentes de cero.
-
c, 4h
+ c ) como una combinación lineal de tres
4. Sea W el espacio generado por f = sen x y g = cos x.
a) Demostrar que para cualquier valor de O, f, = sen (x
+ O) y
g, = cos (x
+ O ) son
vectores en W.
b) Demostrar que f, y g, forman una base para W.
= ( 1, 1) como una combillación lineal de v, = (1, - l), v2 = (3, O), vg =
(2, 1) en dos formas distintas.
b) Demostrar que el resultado del inciso anteriorno viola el teorema 5.4.1.
S. a) Expresar v
6. Sea A una matriz n X n, y sean v , , v2, . . . , vn vectores linealmente independientes en
12" expresados como matrices n X I . ¿Que debe cumplir A a fin de que Av,, Av,, . . . ,
Avn sean linealmente independientes?
7. ¿Una base para Pndebe cor,tener un polinomio de grado k para todo k = O, 1 , 2 , . . . , n?
Justificar la respuesta.
8. Para efectos de este problema, una "matriz en tablero de ajedrez" se defmirá como una
matriz cuadrada A = [ a ..] tal que
II
a,,=
{
1
O
si i + j espar
si i +j es impar
Encontrar el rango y la nulidad de las siguientes matrices en tablerode ajedrez:
Lamatriz 3 X 3 .
b) La matriz 4 X 4 . c) La matriz n X n .
9. Para efectos de este ejercicio, una "matriz en X" se d e f i á como una matriz cuadrada
con un número impar de renglones y de columnas que contiene ceros en todas partes,
excepto en las dos diagonales, donde tiene unos. Encontrar el rango y la nulidad de las
siguientes matrices en X
p
O
0
O
11
LO. En cada inciso, demostrar que el conjunto de polinomios es un subespacio de Pn y
encontrar una base paraéste.
a) Todos los polinomios en Pntales quep( -x) = p(x).
b) Todos los polinomios en Pn tales quep(0)= O.
11. (Pata quienes ya esfudiaton Cdculo.) Demostrar que el conjunto de todos los
polinomios en Pn que tienen una tangente horizontal en x = O es un subespacio de Pn.
Encontrar una base paraeste subespacio.
12. En algebra lineal avanzada se demuestra el siguiente criterio de determinante para el
rango: El rango de una matriz A es r si y sólo si A contiene alguna submatriz r X r
con determinante d$erente de cero y todas las submatrices cuadradas de tamaño su-
Ejercicios complementarios / 33 7
penor tienen determinante igual a cero. (Una submatriz de A es cualquier matriz que
se obtiene al eliminar renglones o columnas de A . La matriz A en sí también se considera como una submatriz de A , ) En cada inciso, aplicar este criterio para encontrar el
rango de la matriz.
13. Usando el resultado del ejercicio 12, encontrar los rangos posibles paralas matrices de
la forma
14. Demostrar: Si S es una base para un espacio vectorial V, entonces para cualesquiera
vectores u y v en V y cualquier escalar k se cumplen las siguientes relaciones:
a)
+ v), = (u), + (v>,.
b) ( W , = k ( q .
"
6.1
PRODUCTOS
INTERIORES
En la sección 4.1 se definió el producto interior euclidiano sobre R” y se usó
para extender los conceptos de longitud y distancia al espacio euclidiano n
dimensional. En esta sección se usarán como axiomas laspropiedades más
importantes del producto interior euclidiano para definir el concepto general de
producto interior; luego se demostrará cómo los productos interiores se pueden
utilizar para definir las ideas de longitud y distancia en espacios vectoriales
diferentes aR”.
PRODUCTOSEnla
INTERIORES
GENERALES
sección 4.1, elproducto interior euclidiano de dos vectores en R” se denotó
por u v. En esta sección será conveniente introducir la otra notación (u, v) para
denotar este producto interior. Con esta notación, las propiedades fundamentales
del producto interior euclidiano enumeradas en el teorema 4.1.2 son precisamente
los axiomas de lasiguiente definición
Definición. Un producto interior sobre un espacio vectorial real V es una función que asocia un número real {u, v) a cada pareja de vectores u y v en V de
forma que los siguientes axiomas se cumplen para los vectores u, v y w en V y
los escalares k.
(1) (u, v > = (v, u)
(2) ( u v, w ) = (u, w )
+
+ { v, w )
[Axioma de simetría]
[Axioma de ahtividad]
339
340
/
Espacios con producto interior
(3) ( k u , v ) = k( u, v )
(4) (v, v ) 2 o
donde ( v , v } = O
si y sólo si v = O
[Axioma de homogeneidad]
[Axloma de positividad]
Un espacio vectorial real con un producto interior se denomina espacio real con
producto interior.
OBSERVACI~N. En el capítulo 10 se estudiarán productos interiores complejos;
es decir, productos interiores cuyos valores son números complejos. Hasta ese
momento se usará la expresión "espacio con producto interior" para indmr que se
trata de un "espacio real con productointerior".
Debido a que los axiomas del producto interior se basan en las propiedades
del producto interior eucliciiano, éste satisface de forma automática los axiomas;
este es el contenido del siguiente ejemplo.
Ejemplo 1 Si u = ( u l , u2, . . . . un) y v
entonces la fórmula
= (vl, vz, . . . , v,J
son vectores en R",
( u , v } = U . v = U ~ U , + U 2 U * + ~ ~ ~ + U , u , '
define a (u, v) como el producto interior euclidiano sobre R". Los cuatro axiomas
del producto interior se cumplen debido al teorema 4.1.2. A
El producto interior euclidtmo es el producto interior más importante sobre
R". Sin embargo, existen varias aplicaciones en las que resulta conveniente modificar el producto interior euclidiano ponderando sus términos de manera Iferente.
En pocas palabras. si
son números reales positivos, que se denominaránpesos, y si u = ( u , , u2, . . . , un)
y v = (vl, v2, . . . ,vn) son vectores en R", entonces se puede demostrar (ejercicio
26) que la fórmula
define un producto interior sobre R"; se denomina producto interior euclidiano
ponderado con pesos wI, w2, . . . , wn.
Para ver una forma en que puede surgir un producto interior euclidiano
ponderado, supóngase que en algún experimento fisico puede obtenerse cualquiera
de n valores numéricos
6. I Productos interiores 1 341
y que m repeticiones del experimento producen estos valores con varias frecuencias; es decir, x1 ocurrefi veces, x2 ocurre& veces, etc. Como en total hay m
repeticiones del experimento,
fl
+- f 2 + . . +
fn=m
Así, el promedio aritmético o la media de los valores numéricos observados (que
se denota por X) es
x = (f, x ) =
W I f 1x1
+ w 2 f 2 x 2 + . + W,f,X,
' '
OBSERVACI~N. Siempre se supondrá que R" tiene el producto interior euclidiano, a menos de que explícitamente se especlfique que tiene algún otro producto
interior. Como se definió en la sección 4.1, R" con el producto interior euclidiano
se denomina espacio euclidiano n dimensional.
Ejemplo 2 Sean u = (u1, u2) y v = (vl, v2) vectores en R2. Comprobar que el
producto interior euclidmno ponderado
(u, v) = 3 u , u , + 2
u 9 2
satisface los cuatro axiomas de producto interior.
Solución. Primero, obsérvese que si en esta ecuación se intercambian u y v, el
miembro derecho permanece igual. Por consiguiente,
Si w = (wl, w2),entonces
con lo que se establece el segundo axioma.
342 / Ffspacioscon producto interior
Luego,
con lo que se establece el tercer axioma
Finalmente,
3
3
Resulta evidente que (v, v} = 3v + 2v O. Además, (v, v} = 3v f + 2v = O si y
sólo si v1 = v2 = O , es decir, si y sólo si v = (vl, v2) = O. Asi, se cumple el cuarto
axioma. A
LONGITVD Y
DISTANCIA EN
ESPACIOS CON
PRODUCTO
INTERIOR
Antes de analizar más ejemplosde productos interiores, se hará una pausa y se
explicará cómoseusan los productos interiores para introducir los conceptos de
longitud y distancia en espacios con producto interior. Recuérdese que en el
espacio euclidiano n dimensional la longitud euclidiana de un vector u = (u1, u2,
. . , un) se puede expresar en términos del producto interior euclidiano como
l/uil = (u -u)'/?
y la distancia euclidiana entre dos puntos cualesquiera u
(vi,v2, . . . . vn) se puede expresar como
d(u, v)
= /Iu - v i / =
[(u - V ) . ( r r "
= (u1,
u2, . . . , un) y v
=
v)]':
[Véanse las fórmulas (1) y (2) de la sección 4.1 .] Tomando como motivación estas
fórmulas, se hace la siguiente definición
Definición. Si V es un espacio con producto interior, entonces la norma (o
longitud) de un vector \\u!/en V se denota por u y se define como
!bI! = (u, u)1'2
La distancia entre dos puntos (vectores) u y v se denota por d(u, v) y se define
como
X(u, v) = ¡/u
- VI/
Ejemplo 3 Si u = (u,: y2, . . . , U,,) y v = (v,, v2, . . . , vn) son vectores en R3 con el
producto interior euchdlano, entonces
-___
/lul/= (u,
U)I'*
= ( u . u)1/2 = f l u ;
+
I
' '
+ u;
6.1 Productos interiores / 343
Y
d(u, v) = //u- VI/ = (u - v, u
=
V(U,-
Ul)2
+ (u*
-
v)l’2
-
u2)2
= [(u - v ) . (u - v ) y
+
‘ ’
. + (u,
- u,)l
Obsérvese que las expresiones anteriores son simplemente las fórmulas estándar
para la norma y la distancia euclidianas que se analizaron en la sección 4.1 [véanse las fórmulas (1) y (2) de esa sección.] A
Ejemplo 4 Es importanteteneren
mente quelanorma
y la distanciadependen del producto interior que se esté usando. Si se cambia el producto interior, entonces también cambian las normas y las distancias entre vectores.
Por ejemplo, para los vectores u = (1, O) y v = (O, 1) en R2 con el producto interior euclidiano se tiene
11u11 = v?TT
Y
d(u, v) = I/u- VI/ = /1(1,
-
1)/1=
=
1
v
,
mv5
=
Sin embargo, si se cambia al producto interior euclidiano ponderado
(u,v ) = 3U,U, + 2u,u,
entonces se obtiene
//u//
= (u, u)’’’ = [ 3(1)(1)
+ 2(0)(0)]1’2 = fi
Y
d(u, v)
= //u
- V I / = ((1,
-
l),(l,
-
1))1’2
= [ 3 ( 1 ) ( 1 ) + 2 ( - 1 ) ( - 1 ) ] ’ ~ 2 = ~A
CIRCUNFERENCIAS Y ESFERAS
UNITARIAS EN
ESPACIOS CON
PRODUCTO
INTERIOR
Si Ves un espacio con producto interior, entonces el conjunto de puntos en V que
satisfacen
I I ~ I I= 1
se denomina egera unitaria o algunas veces circunferencia unitariaen
y R3, estos son los puntos cuya distancia al origen es igual a l.
I/.
En R2
Ejemplo 5
a) Trazar la circunferencia unitaria en un sistema de coordenadas en R2 usando el producto interior euclidiano (u, v) = ulvl + u2v2.
b) Trazar la circunferencia unitaria en un sistema de coordenadas xyz en R3 usando el producto interior euclidiano ponderado (u, v) = $ ulvl + $ u2v2.
Solución de u). Si u = (x, y),entonces llull = (u, u ) ~=’ ~
,/-,
de modo que
la ecuación de la circunferencia unitaria es ,/- = 1 o bien, elevando al cuadrado ambos miembros,
344 i Espacios con producto interior
Como se esperaba, la gráfka de esta ecuación es una circunferencia de radio 1 con
centro en el origen (figura la).
t"
4
Figura 1
Circunferencia unitaria con norma
Circunferencia unitariacon
norma 11u11=
Solución de 6).
d
m
Si u = (x, y), entonces 1 /u/
j = (u, u)li2 = ,/+x2 +$y2 , de modo
que la ecuación de la circunferencia unitaria es
6-7
Lx2 + l y 2 = 1 o bien, elevando
al cuadrado ambos miembros,
x2
y2
-+"=1
9
4
La gráfica de esta ecuación es la elipse que se muestra en la figura 16. A
Seríarazonableque
el lectorsesienta
incómodo conlosresultados
obtenidos en el últimoejemplo.Auncuandolasdefinicionesdelongitud
y
distancia se reducen a las definiciones estándar cuando se aplican a R2 con el
producto interior euclidiano, es necesario recurrir a la imaginación para pensar que l a "circunferencia" unitaria tiene forma elíptica. Sin embargo, aunque
los productos interiores no estándar distorsionan los espacios conocidosy conducen a valores extraños de longitudes y distancias, muchos de los teoremas
básicosde la geometríaeuclidianaaúnsonválidosenestosespacios
poco
comunes. Por ejemplo, es un hechobásico de la geometría euclidiana es que la
suma de las longitudes dedos de los lados de un triángulo es por lo menos tan
grande como la longitud del tercer lado (figura 2a). Después se verá que este
resultado se cumple en todos los espacios con producto interior, sin importar
cuán poco comúnpuedaser
el productointerior. Como otroejemplo, recuérdese el teorema de la geometría euclidiana que establece que la suma de
los cuadrados de las diagonales de un paralelogramo es iguala la suma de los
cuadrados de los cuatro lados (figura 26). Este resultado también es válido en
6.1 Productos interiores / 345
todos los espacios con producto interior, sin importar cuál
terior (ejercicio 20).
a)
Figura 2
PRODUCTOS
INTERIORES
GENERADOS
POR MATRICES
1 " + V/I
sea el producto in-
b)
/1u/1+ b'l/
Ilu + V/12 + l/u- V / l 2 = 2(/lu1I2+ /lV1l2)
El producto interior euclidiano y el producto interior euclidiano ponderadoson
Casos especiales de una clase general deproductos interiores sobre R", que se
describirán a continuación. Sean
U=
[q
y
v = [ q
un
Un
vectores en R" (expresados como matrices n X l), y sea A una matriz invertible n
x n. Sepuede demostrar (ejercicio30) que si uv
es el producto interior
euclidiano sobre R", entonces la fórmula
u
u, v) = Au .Av
define un producto interior; se llama producto interior sobre R" generado por A .
Si se recuerda que el producto interior euclidiano u v puede escribirse como
el producto matricial v'u [véase (7) en la sección 4.11, se concluye que otra forma
de escribir (3) es
-
(u, v ) = (AV)T'4U
o bien, de manera equivalente,
Ejemplo 6 El producto interior sobre R" generado por la matriz identidad n
es el producto interior euclidiano, ya que al sustituir A = I en (3) se obtiene
(u, v) = Iu.Iv
X
n
= u.v
El producto interior euclidiano ponderado (u, v) = 3ulvl + 2 3 v 2 que se analiz6,en
el ejemplo 2 es el producto interior sobre R2 generado por
346
Espaciosconproducto interior
debido a que al sustituir esta matriz en (4) se obtiene
= 3u,u,
+ 2u2u2
En general, el producto interior euclidiano ponderado
{u, v ) = "IU1L'!
+ W7U2U2 f
' '
+ W,U,U,
es el producto interior sobre R" generado por
A-
1 0
.
\$O
0 1
(comprobar). A
En los siguientes ejemplos se describirán algunos productos interiores sobre
espacios vectoriales Qferentes a R".
Ejemplo 7 Si
son dos matrices cualesquiera 2 X 2, entonces la siguiente fórmula define un producto interior sobre M22 (comprobarlo):
Por ejemplo, si
entonces
( U , V ) = 1( - I )
+ 2(0) + 3(3) + 4(2) = 16
6. I Productos interiores / 347
Ejemplo 8 Si
p = a.
+ a,x -1 u2x2
and
q = bo + b,x
+ b2x2
son dos vectores cualesquiera en P,, entonces la siguiente fórmula define un
producto interior sobre P, (comprobar):
( P >S > = aobo + a,b, + 4 9
La norma del polinomio p con respecto a este producto interior es
llPll = (P, P Y
=
VGF2-G
y la esfera unitaria en este espacio consta de todos los polinomios p en P, cuyos
coeficientes satisfacen la ecuación I I pI I = 1, que elevada al cuadrado queda como
Ejemplo 9 (Para quienes y a estudiaron Cúlculo). Sean f = A x ) y g
funciones continuas en C [a,b ] ,y se define
= g(x)
dos
Se demostrará que esta fórmula define un producto interior sobre C [a, 61 al
comprobar los cuatro axiomas de producto interior para las funciones f =Ax), g =
g(x) y S = s(x) en C [a,b]:
b
(1)
(f9
g) =
i,
f ( x M 4 dx =
[
g(x)f@) dx = (g, f )
lo cual demuestra que se cumple el axioma l .
I,
b
(2) ( f + g,
S)
=
cf(x> + g(x))s(x) dx
b
=
I,
b
f ( x > W dx
= (f, S > + (g, S >
+
g(x)s(xl dx
348 / Espacios con producto interior
esto demuestra que el axioma 2 es válido.
(3) ( k t g >=
j6
m)g(X)
dx = k
Jab
f(n)g(x)dx
= k(f, g)
con lo que queda demostrado que se cumple el axioma 3 .
(4) Si f =Ax) es cualquier función en C [a, b ] ,entoncesf(x) 2 O para todo x en
[a,b ] ;por consiguiente,
Además, debido a que$(x) 2 O y f =Ax>es continua sobre la, 61, se concluye que 1,”fZ(x)dx = si y sólo si Ax) = O para todo x en [ a , 61. Por tanto,
se tiene que (f, f ) = 1,” fZ(x>dx = O si y sólo si f = O . Así se demuestra que se
cumple el axioma 4. A
Ejemplo 10 (Para quienesya esfudiaron Cálculo). Si C [a,b ] tiene el producto
interior definido en el ejemplo precedente, entonces la norma de una función f =
Ax) con respecto a este producto interior es
y la esfera unitaria en este espacio consta de todas las funciones f en C [a, b ] que
satisfacen la ecuación llfll= 1, que cuando se eleva al cuadrado queda como
lUbf2(x)dx = 1
A
(Para quienes y a estudiaron Cálculo). Como los polinomios
sonfuncionescontinuas sobre (-m, m) entoncessoncontinuassobrecualquier intervalo cerrado [a, 61. Así, para todos estos intervalos el espacio vectorial P, es un subespacio de C [a, bj, y la fórmula (6) define un producto interior sobre P,.
OBSERVACI~N.
OBSERVACI~N. (Para quienes y a estudiaron Cálculo). Recordar que en Cálculo
la longitud de ara de una curva y =Ax) sobre un intervalo [a,b] está definida por la
fórmula
L
=
Este concepto de longtud de arco no se debe confundir con Ilfll, que es la longitud
(norma) de f cuando f se considera como un vector en C [a,b].Las fórmulas (7) y
(8) son bastante diferentes.
6.1 Productos interiores / 349
ALGUNAS
PROPIEDADES
DE LOS
PRODUCTOS
INTERIORES
En el siguiente teorema se enumeran algunas propiedades algebraicas básicas de
los productos interiores.
Teorema 6.1.1. Si u, v y w son vectores en un espacio real con producto interior y k es cualquier escalar, entonces:
a ) (O, v) = (v, O ) = O
b) (u, v + w ) = (u, v)+ (u, w)
c) (u, kv) = k( u, v)
d ) ( u - v, w ) = (u, w) - (v, w )
e) (u, v - w ) = (u, v) - (u, w )
I
Demostración. Se demostrará el inciso 6) y la demostración de los demás incisos se deja como ejercicio.
(u, v + w )
=
=
=
(v + w, u)
(v, u) + (w, u )
(u, v) + (u, w )
[por simetría]
[por aditividad]
p o r simetría]
0
El siguiente ejemplo ilustra d m o se pueden usar el teorema 6.1.1 y las propiedades que definen los productos interiorespara efectuar cálculos algebraicos con éstos.
A medida quese estudie el ejemplo,
será instructivo que el lector justifiquepasos.
los
Ejemplo 11
( u - ?v, 3u + 4v)
(u, 3u + 4v) - (2v, 3u + 4 v )
= (u, 3u) + (u, 4v) - (2v, 3u) - (2v, 4v)
= 3(u, U)
4( U, V ) - 6 ( ~ , U 8) ( ~V),
= 311~11~
+ 4(u, V )- 6 ( ~V,) - 8 ( ( ~ / ( ~
=
+
3(lu112- 2(u, V ) - 811vI12 A
Como el teorema 6. l.1 es un resultado general, se tiene la garantía de que se
cumple para fodos los espacios reales con producto interior. Este es el verdadero
poder del desarrollo axiomático de los espacios vectoriales y los productos interiores: un sólo teorema demuestra una multitud de resultados de una vez. Por ejemplo, sin necesidad de ninguna demostración adicional se tiene la garantía de que
las cinco propiedades dadas en el teorema 6.1.1 son verdaderas para el producto
interior sobre R" generado por cualquier matriz A [fórmula (3)]. Por ejemplo, para
este producto interior se comprobará el inciso b) del teorema 6. l . 1 :
(u, v + w )
(v + w)TATAu
+ wT)ATAu
[Propiedad de la transpuesta]
= (V'A~AU)
+ (w'A 9 ~ )[Propiedad de la multiplicaciónde matrices]
=
= (VT
= (u, v)
+ (u, w )
350
Espacios con producto interior
Será instructivo para el lector comprobar los demás incisos del teorema 6.1.1 para
este producto interior.
EJERCICIOS DE LA SECCIóN 6.1
1. Sea (u, v) el producto interior euclidiano sobreR2, y sean u = (3, -2), v = (4, 5),
w=(-1,6)yk=-4,Encontrar
a) (u, v ) = (v, U )
d)(ku,v)=k(u,v)=(u,kv)
b)(u+v.w)=(u,w)+(v,wj
e) (O.v}=(v,O)=O
(c) ( I I , V + W ) = ( U , V ) + ( U , W )
2. Repetir el ejercicio 1 para el producto interior euclidiano ponderado (u, v)
5U2V2.
= 4u,v,
+
3. Calcular (u, v) usando el producto interior del ejemplo 7
4. Calcular (p, q) usando el producto interior del ejemplo 8.
a) p = - 2 + x + 3 x 2 ,
q=4-7x2
b) p = - 5 + 2 x + x 2 ,
5. a) Usando la fórmula (7), demostrar que (u, v) = 9u,vl
q=3+2x-4x2
+ 4u2v2 es el producto interior
sobre R2 generado por
b) Con el producto interior del inciso a), calcular (u, v) si u = (-?,2) y v = ( I , 7).
6 a) 7Jsar la fórmula (3), para demostrar que (u, v) = Su,vi
- u,v2 - u2vl + 10u2v2es el
producto interior sobre R2 generado por
b) Usando el producto interior del inciso a), calcular (U, v) si U = (o, -3) y v = (6,2).
7. Sean u = ( u , , u2) y v = ( Y , , v2). En cada inciso, la expresión dada es un producto in-
terior sobre R2. Encontrar una matriz que lo genere.
a) (u, v ) = 3u,u, + 5u2u2
b) ( u , v ) = 4u,u, + 6 u p 2
8. Sean u = (U,, U*) y v = (v,,v2). Comprobando que se cumplen los axiomas de producto in-
terior, demostrar que las siguientes expresiones definen productos interiorcs sobreR2.
a) (u. v ) = 3u,u, + 5 1 y 2
b) ( U , v ) = 4u,u, + u2ul + u l u 2 + 4u:Uz
9. Sean U = ( u , , u2, u2) y v = (v,, v , vJ. Determinar cuáles de las siguientes expresiones
son productos intenores sobre RS . Para las que no 10 sean, enumerar 10s aXiomas que
no se cumplen.
6.1 Productos interiores / 351
a) ( uv,)
C) ( U , V )
+ u3u3
= ~ u , u+, u2u2 + ~ u , u ,
= ulul
b) (u, v ) = .:u: +
+ U$:
d ) ( U , V ) = u I u I - u2u2 + ~ 3
~
3
10. En cada inciso, usando el producto interior sobre
R2, encontrar llwll donde w = (- 1, 3 ) .
a) El producto interior euclidiano.
b) El producto interior euclidiano ponderado (u, v) = 3u,v, 4- 2u2v2,donde u = (u,, u2)
Y v = (VI > v,).
c) El producto mterior generado por la matriz
A = [ -1
'1
3
11. Con los productosinteriores del ejercicio 10, hallar
d(u, v) para u = (- 1,2) y v = (2,5).
13. SeaMz2con el producto interior del ejemplo 7. En cada inciso, encontrar lv11.
14. Sea P, con el producto interior del ejemplo 8. Hallar d(p, 9).
p = 3 - x q+=x 2* +, 5 x *
15. SeaMZ2con el producto interior del ejemplo 7. Encontrar d(A, B).
16. Supóngase que u, v y w son vectores tales que
(u, v ) = 2,
(v, w ) = -3, (u, w)
= 5,
I I ~ I I= 1,
IIVII = 2,
llwll= 7
Evaluar la expresión dada.
a) ( u + v , v + wb) ) ( 2 ~ - ~ , 3 ~ + 2 ~ )
4 IIU + VI1
e) I12w
-
vll
C)
f)
(u-v-~w,~u+v)
j l u - 2v + 4w/l
17. (Para quienes ya estudiaron CcUCurO). Sea el espacio vectorial P, con el producto
interior
( P, 9 ) =
J: p(x)q(x)
dx
a) Determinar llpll para p = 1, p = x y p = 2. b) Encontrar d(p, q) si p = 1 y q =x.
18. Trazar la circunferencia unitaria en R2 usando el productointerior dado.
b) ( u , v ) = 2u,u, + u2u2
a) ( u , v ) = $u,u, + &u2u2
19. Encontrar un producto interior euclidiano ponderado sobre R2 para el cual la circunferencia unitaria sea la elipse que se muestra en la figura 3 .
352
1'
Espacios con producto interior
"c">ii
Figura 3
20. Demostrar que la siguiente identidad se cumple para vectores en cualquier espacio con
producto interior.
+ VI/* + //u
//u
- V/IZ
+ 21jv112
= 2//U1l2
21. Demostrar que la siguiente identidad se cumple para vectores en cualquier espacio con
producto interior.
(u, v ) = +l/u + vil2 - allu - vil2
22.
Demostrar que (U,
= u l v l + u2v3 + u3v2+ u4v4 no
es un producto interior sobre M2,.
23. Sean p = p ( x ) y q = q(x) polinomios en P,. Demostrar que
(P?9 ) =p(O)q(O)+ P ( M % )+p(l)q(l)
es un producto interior sobre P,
24. Demostrar: Si (u, v) es un producto interior euclidiano sobre R" y si A es una matnz n
X n, entonces
(u, .4v) = ( A T U , V )
[Sugerencia Usar el hecho de que (u, v) = u . v = vTu.]
25. Comprobar el resultado del ejercicio 24 para el producto interior euclidiano sobre R3 y
26. Sean u = (u1, u,,
.
. . , un)y
v = (y1, v2, . . . , v,). Demostrar que
( u , v ) = W I U I U ,+ W2U2U*
+
' ' '
+ w,u,u,
es un producto interior sobre R" si wl, w2,. . . , w n son números reales positivos.
27.
calcular (p, q) para los vectores p = p ( x ) y q = q(x) en P3.
a) p = 1 - x + x x z + 5 x 3
q=x-3x2
b)p=x-5x3
q =2
+ 8x2
6.2 Ángulo y ortogonalidad en espacios con producto interior / 353
28. (Para quienes ya estudiaron C6lculo). En cada inciso, usarel producto interior
(f, g) =
Io1
f(x)g(x) dx
para calcular (f, g) de los vectores f =Ax) y g = g(x) en C [O, 11 .
b) f = x , g = e "
a) f = c o s 2 mg,= s e n 2 m
Tr
C)
f = t a n -4x ,
g= 1
29. Demostrar que el producto interior delejemplo 7 sepuede escribir como (U,
tr( U%).
=
30. Demostrar que la fórmula (3) define un producto interior sobre R". [Sugerencia Usar
la otra versión de la fórmula (3), definida por (4).]
31. Demostrar que la matriz (5) genera el producto interior euclidiano ponderado
(u, v ) = w l u l u l
+ w2u2u2 +
'
'
+ wu,u,,
sobre R".
32. Demostrar los incisos a) y d)del teorema6. l. l.
33. Demostrar los incisos c) y e ) del teorema 6. l. l.
6.2 ÁNGULO Y ORTOGONALIDAD ENESPACIOS CON
PRODUCTO INTERIOR
En esta sección se definirá el concepto de ángulo entre dos vectores en un espacio con producto interior, y esta idea se usará para obtener algunas relaciones
básicas entre vectores en un espacio con producto interior, incluyendo una relacibn geométrica fundamental entre el espacio nulo y el espacio columna de una
matriz.
DESIGUALDAD
DE CAUCHYSCHWARZ
Recuérdese por la fórmula (1) de la sección 3.3 que si u y v son dos vectores diferentes de cero en R2 o en R3 y 8 es el ángulo entre estos vectores, entonces
u v
= llull llvll cos
o
(1)
o bien, de otra manera,
cos
o = - u.v
llull llvll
En el primer objetivo de esta sección es definir el concepto de ángulo entre
dos vectores en un espacio general con producto interior. Para que la definición
sea razonable, sería bueno que fueseconsistente con la fórmula (2) cuando se aplique al caso especial de R2 y R3 con el producto interior euclidiano.A s í , se quiere que
la definición del ángulo 8 entre dos vectores diferentes de cero en un espacio con
producto interior cumpla la relación
354
1
Espacios con producto interror
Sin embargo, debido a que /cos 8 1 5 1, no hay ninguna posibilidad de que ( 3 ) se
cumpla, a menos de que se tenga la certeza de que toda pareja de vectores diferentes de cero en unespacio con producto interior satisface la desigualdad
Afortunadamente será posible demostrar que así es, usando la siguente generali
zación del la desigualdad de Cauchy-Schwarz (véase el teorema 4.1.3).
Teorema 6.2.1, Desigualdad de Cauchy-Schwarz). Si u y v son vectores en un
espacio real con producto interior, entonces
Demostración. De antemano se advierte a lector que la demostración aquí
presentada depende de una argucia sutil que no es fácil motivar. Si u = O, entonces
(u. v) = (u, u) = O, de modo que los dos miembros de (4) son iguales. Supóngase
ahora que u f O . Sean a = (u, u), b = 2(u, v). c = (v, v) y sea t cualquier número
real. Por el axioma de positividad, el producto interior de cualquier vector consigo
mismo siempre es positivo. Por consiguiente,
o 5 ((tu + v), (tu + v ) ) = (u, u ) t 2 + 2(u, v)t + ( v , v )
=
at2
+ bt + c
Esta desigualdad indica que el polinomio cuadrático at2 + bt + c no tiene raíces
reales o tiene una raíz real repetida. En consecuencia, su discriminante debe satisfacer la desigualdad b2 - 4ac 5 O. Expresando los coeficientes a, b y c en térmiv) 5 O o bien, de manera
nos de los vectores u y v se obtiene 4(u, v)’ - 4(u,,.()U
cquivalente,
5
(u,
( u , u ) ( v v, ?
Extrayendo raíz cuadrada a ambos miembros y aplicando el hecho de que (u, u)
y (v. v) son no negativos se obtiene
l(u, v)l
5: (u,
u)”2(v,
o bien, de manera equivalente,
I(K
v)l
5
llull llvll
Y)”?
6.2 Angulo y ortogonalidad en espacios con producto interior / 355
con lo que se completa la demostración.
U
Para referencia, se observa que la desigualdad de Cauchy-Schwarz se puede
escribir de otras dos formas:
p T Z K T - 1
m[
(5)
(6)
La primera de estas fórmulas se obtuvo en la demostración del teorema 6.2.1, y la
segunda se obtiene de la primera aplicando
el hecho de que llull2 = (u, u)y
llV1l2 = (v,v).
Ejemplo 1 La desigualdad de Cauchy-Schwarz para R" (teorema 4.1.3) se concluye como un caso especial del teorema 6.2.1 tomando a (u, v) como el producto
interior euclidiano u v. A
PROPIEDADES
DELA
LONGITUD Y LA
DISTANCIA EN
ESPACIOS CON
PRODUCTO
INTERIOR
Losdos teoremas siguientes demuestran que las propiedades básicas de la longitud
y la distancia establecidas en los teoremas 4.1.4 y 4.1.5 para vectores en el espacio
euclidiarro n dimensional son válidas en espacios generales con producto interior.
Este hecho es una evidencia deque las definiciones de producto interior, longitud
y &stancia están bien elegidas.
Teorema 6.2.2. Si u y v son vectores en un espacio V con producto interior y
si k es cualquier escalar, entonces:
a)
llull 2 0
b) llull = O si y sólo si u = O
c ) llkull = Ikl llull
d ) I ~ u + 5 ~~u~~
+ Ilvll (Desigualdad del triúngulo)
~
~~~~
1
Teorema 6.2.3. Si u, v y w son vectores en un espacio V con producto interior
y si k es cualquier escalar, entonces:
a)
b)
c)
d;
d ( u , v2
) O
d(u,v)=Osiysólosiu=v
d ( u , v )= d(v, U )
d ( u ,V ) 5 d(u, W ) + d ( w , v ) (Desigualdad del triángulo)
I
Se demostrará el inciso d) del teorema 6.2.2 y la demostración de los demás incisos de este teorema, así como la demostración del teorema 6.2.3, se dejan como
ejercicio.
356 / Espacios con producto interior
Demostración del teorema 6.2.2d Por definición,
llu
+
VI12 =
(u
+ v, u + v )
=
(u, u ) + 2(u, v )
9
(u, u )
+ (v, v )
+ 2/(u, v)l + (v, v )
l l ~ l l l l ~ (v,
l l +v>
= llU1l2 + 2llull I b ! l + 11vIl2
5
(u, u >+ ~
= (llull
[Propiedaddel valor absoluto]
[~or(4)1
+ /lv11)2
Extrayendo raíz cuadrada se obtiene
l b + VI1 Illull + llvll 0
ÁNGULO ENTRE
VECTORES
A continuación se mostrará cómo se puede usar la desigualdad de Cauchy-
Schwarz para definir hgulos en espacios generales conproducto interior. Supóngase que u y v son vectores diferentes de cero en un espacio V con producto interior. Si ambos miembros de la fórmula (6) se dividen entre llull llvll se obtiene
',
o bien, de manera equivalente,
Luego, si 8 es un ángulo cuya medida en radianes varía de O a x, entonces cos 8
asume todos los valores entre - 1 y 1 (inclusive) exactamente una vez (figura 1).
Así, por (7) existe un h g d o 8 único tal que
Se define a 8 como el ángulo entre u y v. Obsérvese que en R2 o en R3 con el producto interior euclidiano, la expresión (8) concuerda con la fórmula usual para el
cosen3 del ángulo entre dos vectoresdiferentes de cero fórmula (2).
6.2Ángulo y ortogonalidad en espacios con producto interior / 357
Ejemplo 2 Sea R4 con el producto interior euclidiano. Encontrar el coseno del
ángulo 0 entre los vectores u = (4, 3, 1, -2) y v = (-2, 1, 2, 3).
Solución.
Se deja para el lector comprobar que
I(u(/=
m,
jlvll =
m,
y
( u , v ) = -9
de modo que
cos
o = -(u,
- v)
II~IIIIVII-
ORTOGONALIDAD
-
9
mm
3
A
"
=
2 f i
El ejemplo 2 esen esencia un ejercicio matemático, ya que hay relativamente poca
necesidad de encontrar ángulos entre vectores, excepto en R2 o en R3 con
el
producto interior eucli&ano. Sin embargo, un problema de importancia capital en
todos los espacios con producto interior es determinar si dos vectoresson
ortogonales; es decir, si el ángulo entre ellos es 0 = n/2.
Por (8) se concluyeque si u y v son vectoresdferentes de cero en un espacio
con producto interior y 0 es el ángulo entre ellos, entonces cos 0 = O si y sólo si (u,
v) = O. De manera equivalente, para vectores diferentes de cero se tiene 0 = n/2 si
y sólo si (u, v) = O. Si por acuerdo se considera el ángulo entre u y v como n/2
cuando uno de los vectores es O o ambos vectores son O, entonces se puede afirmar
sin excepción que el ángulo entre u y v es n / 2 si y sólo si (u, v) = O. Este hecho
sugiere la sigwente definición.
Definición. Dos vectores u y v en un espacio con producto interior se denominan ortogonales si (u, v) = O.
Obsérvese queen el caso especial en que (u, v) = u v es el producto interioreuclidiano sobre R", la definición anterior se reduce a la definición de ortogonalidad en el espacto euclidlano n dunensional proporcionadaen la sección4. l. También se hace notar
que la ortogonalidad depende del producto interior; dos vectores pueden ser ortogonales
con respecto a un producto interior pero pueden no serlo con respecto a otro.
Ejemplo 3 Si M,, tiene el producto interior del ejemplo 7 de la sección
precedente, entonces las matrices
son ortogonales, ya que
( U , V ) = 1(O)
+ O(2) + 1(O) + 1(O) = O
A
Ejemplo 4 (Para quienes y a estudiaron Cálculo). Sea Pz con el productointerior
358 / Espacios con producto interior
y sea
p=x,
q=x2
Entonces
Debido a que (p, q) = O, los vectores p = x y q = x2 son ortogonales con respecto al
producto interior dado. A
En la sección 4.1 se demostró el teorema de Pitágoras para vectores en el
espacio euclidiano de dimensión n. El siguiente teorema amplía este resultado a
vectores en cualquier espacio con producto interior.
Teorema 6.2.4. (Teorema de Hfágoras generalizado). Si u y v son vectores
ortogonales en un espacio con producto interior, entonces
IlU + V I 2 = lIU1l2
Demostración.
+ llv112
La ortogonalidad de u y v indica que (u, v) = O, de modo que
Ejemplo 5 (Para quienes ya estudiaron Cálculo). En el ejemplo 4 se demostró
que p = x y q = x2 son ortogonales con respecto al producto interior
I
sobre P2. Por el teorema de Pitágoras se concluye que
IIP + 9!12= llP112 + 1I41l2
Así, por los cálculos en el ejemplo 4 se tiene
6.2 Ángulo y ortogonalidad en espacios con producto interior / 359
Este resultado se puede comprobar porintegración directa:
COMPLEMENTOS Si Ves un plano que pasa por el origen de R3 con el producto interior euclidianc,
entonces el conjunto de todos los vectores que son ortogonales a cada vector en V
ORTOGONALES
forman la recta L que pasa por el origen y es perpendicular a V (figura 2). En
términos de álgebra lineal, se dice que la recta y el plano son complementos
ortogonales entre sí. La siguiente definición amplía este concepto a espacios
generales con producto interior.
Figura 2
todo vector en V .
I
Definición. Sea W un subespaciode un espacio V con producto interior. Se
dice que un vector u en Ves ortogonal a W si es ortogonal a todo vector en W,
y el conjunto de todos los vectores en V que son ortogonales a W se denomina
complemento ortogonalde W.
Recuérdeseque en geometría elsímbolo I seusa para indicar perpendicularidad. En álgebra lineal, el complemento ortogonal de un subespacio IV se
denota por W*(que se lee como " W perpendicular"). En el siguiente teorema se
enumeran las propiedades básicas de los complementos ortogonales.
Teorema 6.2.5. Si W es un subespacio de un espacio V de dimensión finita con
producto interior, entonces
a ) W' es un subespacio de V.
b ) El Único vector común a W y WL es O .
c ) El complemento ortogonal de WL es W; es decir, (WL)I
= W.
360
Espaciosconproducto interior
Se demostrará el inciso a ) , y la demostración de los demás incisos se deja como
ejercicio.
Demostración de a).Primero obsérvese que (O, w) = O para todo vector w en W , de
modo que WLcontiene por lo menos al vector cero. Se quiere demostrar que WLes
cerrado bajo la adición y la multiplicación escalar; es decir, se quiere demostrar
que la suma de dos vectores en WL es ortogonal a todo vector en W y que cualquier
múltiplo escalar de un vector en W" es ortogonal a todo vector en W. Sean u y v
dos vectores cualesquiera en W L , sea k cualquier escalar y sea w cualquier vector
en W. Entonces por la definición de W" se tiene (u, w) = O y (v, w) = O. Usando
las propiedades básicas del producto interior se tiene
(u+v,w)=(u,w)+(v,w)=0+0=0
(ku, w ) = k(u, w ) = k(0) = o
lo cual demuestra que u + v y ku estjn en W" .
0
Debido a que por el inciso c ) del teorema precedente W y W'- son
complementos ortogonales entre sí, se dirá que W y WL son complementos orto-
OBSERVACI~N.
gonales.
El siguente teorema fundamental establece un vínculo geométrico entre el espacio
RELACI~N
nulo y el espacio renglón de una matriz.
GEOMÉTRICA
ENTRE EL
ESPACIO NULO Y Teorema 6.2.6. Si A es una matriz m X n, entonces:
EL ESPACIO
RENGLÓN
a ) El espacio nulo de A y el espacio renglón de A son complementos ortogonales en R" con respecto al producto interior euclidiano.
b ) El espacio nulo de A T y el espacio columna de A son complementos ortogonales en Rm con respecto al producto interior euclidiano.
Demostración de a). Se desea demostrar que el complemento ortogonal del espacio
renglón de A es el espacio nulo de A . Para lograr esto es necesario demostrar que
si un vector v es ortogonal a todo vector en el espacio renglón, entonces Av = O y,
recíprocamente, si Av = O, entonces v es ortogonal a todo vector en el espacio renglón.
Supóngase primero que v es ortogonal a todo vector en el espacio renglón de
A . Entonces, en particular v es ortogonal a los veetores renglón r,, r2, . . . , rn
de A: es decir
Pero por la fórmula (1 1) de la sección 4.1, el sistema lineal Ax
presar en notación de producto punto como
=
O se puede ex-
6.2 Ángulo y ortogonalidad en espacios con producto interior 1 361
de modo que por (9), v es una solución de este sistema y, por tanto, está en el
espacio nulo de A .
Recíprocamente, supóngase que v es un vector en el espacio nulo de A , de
modo que Av = O . Por (10) se concluyeque
r l . v= r2.y =1.. . = r,.v = O
Pero si r es cualquier vector en elespacio renglón de A , entonces r se puede
expresar como una combinación lineal de los vectores renglón de A , por ejemplo
r = c,r, + c2r2+ .
'
. + c,r,
Por tanto,
r - v = (cIrI+ c2r2+ . . . + c,r,)-v
= c l ( r I .v) + c2(r2.v) + . . . + c,(r, v)
-
=o+o+...+o=o
con lo cual se demuestra que v es ortogonal a todo vector en el espacio renglón de
A.
Demostración de b). Como el espacio columna de A es el espacio renglón de AT
(excepto por alguna diferencia en la notación), esta demostración se concluye al
aplicar el resultado del inciso a ) a A T. 0
El ejemplo siguiente muestra cómo se puede usar el teorema 6.2.6 a fin de
encontrar una base para el complemento ortogonal de un subespacio del espacio
euclidiano de dimensión n o n dmensional.
Ejemplo 6 Sea W el subespacio de R5 generado por los vectcres
w1 = (2, 2, - 1, o, 11,
w , = ( l , 1, - 2 , 0 , " l ) ,
w* = ( - 1, - 1, 2, -3, l),
w 4 = ( 0 , 0 , 1 , 1, 1)
Encontrar una base para el complemento ortogonal de W.
Solución. El espacio Wgenerado por wl, w2, w3 y w4 es el mismo que el espacio
renglón de lamatriz
362
Espacios con producto interior
2
L
1
O
o
2 - 1
1
o
-2
- l0
1
- 31
1
-1
'
1
y, por el inciso a) del teorema 6.2.6, el espacio nulo de A es el complemento
ortogonal de W. En el ejemplo 4 de la sección 5.5 se demostró que
]
O
0
forman una base para este espacio nulo. Expresando estos vectores en la misma
notación que wl, w2, w3 y w4 se concluyeque los vectores
"I
= i1,1,
o, o, 0)
y
v 2 = ( - l , O , -1,o, 1)
forman una base para el complemento ortogonal de W. Como comprobación,
calculando los productos punto necesarios, el lector puede veniicar que v1 y v2 son
ortogonales a w l , w2, w3 y w4. A
+.
Teorema 6.2.7. Si A es una matriz n X n, y si TA 1 R" R" es la multiplicación
por A , entonces lassiguientes proposiciones son equivalentes.
a ) A es invertible.
b ) Ax = O sólo tiene la solución trivial.
c ) La forma escalonada reducida deA es I,,
d) A se puede escribir como un producto de matrices elementales,
e ) ifx = b es consistente para toda matriz b n X 1.
fi A x = b tiene exactamente una solución para toda matriz b n X 1.
S> deffJ f o.
h ) Id rango de 7> es Rn.
i ) TA es uno a uno.
j ) Los vecfores columna de A son linealmente independientes.
k) Los vectores renglón de A son linealmente independientes.
I) Los vectores columna deA generan a R".
m) Los vectores renglón de A generan a Rn.
n) Los vectores columna de A forman una base para R".
o) Los vectores renglón deA forman una basepara R".
p) El rango de A es n.
q) La nulidad de A es O.
r) El complemento ortogonal del espacio nulo de A es Rn.
S) El complemento ortogonal del espacio renglón deA es (O) .
6.2 Ángulo y ortogonalidad en espacios con producto interior
363
Este teorema relaciona todos los temas principales estudiados hasta el momento.
Se deja como ejercicio para el lector demostrar que en cualquier espacio V con
producto interior, el espacio cero { O ) y todo el espacio V son complementos
ortogonales. Entonces, si A es una matriz n X n, afirmar que Ax = O sólo tiene la
solución trivial es equivalente a decir que el complemento ortogonal del espacio
nulo de A es todo R" o, de manera equivalente, que el espacio renglón de A es todo
R". Este hecho permite agregar dos nuevos resultados a los 17 resultados mencionados en el teorema 5.6.9.
RESUMEN
EJERCICIOS DE LA SECCIóN 6.2
1. En cada inciso, determinar si los vectores dados son ortogonales con respecto al producto
interior euclidiano.
a) u = ( - 1 , 3, 2), v = (4, 2, - 1)
c) = ( U l , U 2 r Uj), v = (O,
O,
0)
e) u=(O, 3, -2, I), v = ( 5 , 2, -1, O)
b ) u = ( - 2 ,- 2 ,- 2 ) ,
v = ( l , 1, 1)
d ) u = ( - 4 , 6 , -10, l), ~ = ( 2 1,, - 2 , 9 )
f ) u = ( a , b), v = ( - b , a)
2. Sea @ con el producto interior euclidiano, y sea u = ( - 1, 1, O, 2). Determinar si el vector
u es ortogonal al conjunto de vectores W = {w,, w2, w3), donde w, =(O, O, O, O), w2 = (1,
- 1,3J y w3 = (4, O, 9,2).
3. Sean R2, R3 y
@ con el producto interior euclidiano. En cada inciso, hallar el coseno del
ángulo entre u y v.
a) u = ( I , -3), v = (2, 4)
b) U = ( - I , O), v = ( 3 , 8)
c) u = ( - 1 , 5, 2), v = (2, 4, -9)
d) U = (4, 1, 8), v = (1, O, - 3 )
e ) u = ( l , O , l,O), v = ( - 3 , -3,-3,
-3)
f) u = ( 2 , 1, 7, - I ) , v = ( 4 , 0 , 0 , 0 )
4. Sea P2 con el producto interior del ejemplo 8 en la sección 6.1. Encontrar el coseno del
ángulo entre p y q.
a) p = - 1 + 5x + 2x2, q = 2 + 4x - 9x2
b) p = X - x2, q = 7
+ 3x + 3x2
5. Demostrar que p = 1 - x + 2x2 y q = 2x + .? son ortogonales con respecto al producto
interior del ejercicio 4.
6. Sea M22 con el producto interior del ejemplo 7 en la sección 6. l . Encontrar el coseno del
ángulo entre A y B.
7. Sea
A = [ -1
'1
3
364 / Espacios con producto interior
¿Cuáles de las siguientes matrices son ortogonales a A con respecto al producto interior
del ejercicio 6?
8. Sea R3 con el producto interior euclidiano. ¿Para qué valores de k son ortogonales u y v?
a) u = ( 2 , 1 , 3 ) , v = ( l , 7 , k )
b) u = ( k , k , l ) , v = ( k , 5 , 6 )
9. Sea
con el producto interior euclidiano. Encontrar dosvectores de norma 1 que sean
ortogonales a los tres vectores u = (2, 1, -4, O), Y = (- 1, - 1,2,2) y w = (3,2,5,4).
10. En cada inciso, con el producto interior euclidiano comprobar que la desigualdad de
Cauchy-Schwarz se cumple para los vectores dados.
a) u = (3, 2), v = (4, - 1)
b ) ~ = ( - 3 , 1 , 0 ) , ~ = ( 2 -,1 , 3 )
C) ~ = ( - 4 , 2 ,I), v = ( 8 , -4, -2)
d) u = ( O , - 2 , 2 , I ) , v = ( - l , - 1 , 1, I )
11. En cada inciso, comprobar que la desigualdad de Cauchy-Schwarz se cumple para los
vectores dados.
a) u = (-2, 1) y v = (1, O), usando el producto interior del ejemplo 2 en la sección 6. l .
usando el producto interior del ejemplo 7 en la sección 6.1.
c) p = - 1 + 2x + 2 y q = 2 - 4 2 usando el producto interior dado en el ejemplo 8 de
la sección 6.1,
12. Sea W la recta en R2 cuya ecuación es y = 2x.Encontrar una ecuación para
WL
13. a) Sea W el plano en R3 cuya ecuación es x
- 2y - 32 = O. Encontrar las ecuaciones
paramétricas para WL
b) Sea Wla recta en R3 con ecuaciones paramétricas
n=2t,
J'"
-st,
z=4t
("<<<E)
D e t e m ~ a una
r ecuación para WL
14. Sea
2
-1
A=[:
a]
2
a) Encontrar bases para el espacio renglón y el espacio nulo de A .
b) Comprobar que todo vector en el espacio renglón es ortogonal a todo vector en el
espacio nulo (como garantiza el teorema 6 . 2 . 6 ~ ) .
15. Sea A la matriz1 ejercicio 14.
a) Encontrar bases para el espacio columna de A y el espacio nulo de AT
b) Comprobar que todo vector en el espacio columna de A es ortogonal a todo vector en
el espacio nulo de AT (como garantiza el teorema 6.2.6b).
6.2 Ángulo y ortogonalidad en espacios con producto interior / 365
16. Encontrar una base para el complemento ortogonal del subespaciode R" generado por los
vectores
a) vI = (1, - 1, 3), v2 = (5, -4, -4), v3 = (7. -.6, 2 1
b) V I = (2, O, - l), vZ = (4, O, -2)
c)v,=(l,4,5,2),v2=(2,1,3,0),v3=(-1,3,2,2)
d)~,=(l,4,5,6,9),~~=(3,-2,1~4,-1),~~=(-I,0,-1,-2,-1),
v4 = (2, 3, 5, 7, 8)
17. Sea V un espacio con productointerior. Demostrar que si u y v son vectores ortogonales en
Vtales que llull= llvll= 1, entonces ~ l u- V I I =
a.
18. Sea V un espacio con producto interior. Demostrar que si w es ortogonal tanto a u, como a
u2, entonces es ortogonala k,u, + k2u2 paratodos los escalares k , y k2. Interpretar
geométricamente este resultadopara el casoenque V es R3 con el producto interior
euclidiano.
19. Sea V un espacio con producto interior. Demostrar que si w es ortogonal a cada unode los
vectores u,, u2, . . . , u,, entonces es ortogonal a todo vector en lin {u,, u2, . . . ,u }, .
20. Sea {v,, v2, . . . , v,} una base para un espacio V con producto interior. Demostrar que el
vector cero es el Úmco vector en V que es ortogonal a todos los vectores básicos.
21. Sea {w,, w2, . . . , w,}una base para un subespacio CV de V. Demostrar que WL consta de
todos los vectores en V que son ortogonales a todos los vectores básicos.
22. Demostrar la siguiente generalización del teorema 6.2.4. Si v,, v2, . . . , Y, son vectores
ortogonales por parejas en un espacio V con producto interior, entonces
23. Demostrar los siguientes incisos del teorema6.2.2:
a) Inciso a).
b) Inciso b).
c) Inciso e).
24. Demostrar los siguientes incisos del teorema6.2.3:
a) Inciso 4).
b) Inciso b). c)
Inciso c). d) Inciso S,
25. Demostrar el inciso b ) del teorema 6.2.5.
26. Demostrar: Si u y v son matricesn
X
1 y A es una matriz invertiblen
X
n, entonces
[vTATAu]25 (urATAu)(v*A*Av)
27. Por medio de la desigualdad de Cauchy-Schwm, demostrar que para todos los valores
reales de a , b y 8 ,
366 i Espacios con producto interior
29. Demostrar que la igualdad se cumple en la desigualdad de Cauchy-Schwarz si y sólo si u y
v son linealmente dependientes.
30. (Para quienes y a estudiaron Ccilculo). Sea C [O, x]con el producto interiol
( f , g) = i h d x ) dx
Y sea f, = cos nx ( n = O , 1, 2, . . . ). Demostrar que si k # I, entonces fk y fi son ortogonales
con respecto al producto interior dado.
31. (Para quienes y a estudiaron Chkulo). Seanfix) y g(x) funciones continuas sobre [O, 11 .
Demostrar:
[Sugerencia Usar
la desigualdad de Cauchy-Schwarz.]
32. Mediante métodos vectoriales, demostrar que el triángulo inscrito en una circunferencia,
de modo que uno de sus lados es el diámetro de la circunferencia, debe ser un triángulo
rectángulo. [Sugerencia Expresar los vectores AB y BC de la figura 3 en términos de u y
v. 1
a)
33. Con respecto al producto interior euclidiano, la norma de los vectores u = (1,
y
v = ( - 1, 3 ) es igual a 2, y el ángulo entre u y v mide 60° (figura 4). Encontrar un producto interior euclidiano ponderado con respecto al cual u y v sean vectores unitanos ortogonales.
Figura 4
6.3 Bases ortonormales; proceso de Gram-Schmidt; descomposición QR / 367
6.3 BASES ORTONORMALES; PROCESO DE GRAM-SCHMIDT;
DESCOMPOSICIóN QR
En muchos problemascon espacios vectoriales, quien resuelve el problema
puede
elegir cualquier base que juzgue pertinente para el espacio vectorial. En espacios
conproductointerior,
la solución de un problemaamenudo
se simplGca
bastante al elegir una base en la que los vectores sean ortogonales entre sí. En
esta sección se mostrará cómo es posible obtener las bases.
BASES
ORTOGONALES
Y ORTONORMALES
DefinicMn.Un conjunto de vectoresenun
espacio con producto interior se
denomina conjunto ortogonal si todas las parejas de vectores distintos en el
conjunto son ortogonales. Un conjunto ortogonal en el que cada vector tiene
norma 1 se denomina conjunto ortonormal.
Ejemplo 1 Sean
u1 =(O,
1,0),
u , = ( l , O , l),
u , = ( l , O , -1)
y supóngase que R3 tiene elproducto interior euclidiano. Seconcluye que el
conjunto de vectoresS = {ul, u2, u3} es ortogonal, ya que (u1, u2) = (ul, u3) = (u2,
u3) = O. A
Si v es un vector no nulo en un espacio con producto interior, entonces por
el inciso c ) del teorema 6.2.2 el vector
1
mv
tiene norma 1, ya que
El procesode multiplicar un vector v diferente de cero por elrecíprocode su
longitud para obtener un vector de norma 1 se denomina normalizacidn de v. Un
conjunto ortogonal de vectores no nulos siempre se puede convertir en un conjunto
ortonormal al normalizar cada uno de sus vectores.
Ejemplo 2 Las normas euclidianas de los vectoresen el ejemplo 1 son
I I Y I I = 1,
IIu211 =
f i 9
En consecuencia, al normalizar u u2 y u3 se obtiene
11~311=
u5
36% í Espacios con producto interior
El lector debe comprobar que el conjunto S
mostrar que
(v,,
v2)
=
{vl, v2, v3> es ortonormal, al de-
= ( V I , v3) = ( v 2 , v3) = 0
IlVlll = llvzll
= llv3ll = 1 A
En un espacio con producto interior, una base que consta de vectores ortonormales se denomina base ortonormal,y una base que consta de vectores ortogonales se denomina base ortogonal. Un ejemplo conocido de una base ortonormal
es la base estándar para R3 con el producto interior euclidiano:
i=(l,O,O),
k=(O,O, 1)
j = ( O , l,O),
Esta es la base asociada con los sistemas de coordenadas rectangulares (figura 4 de
la sección 5.4). En términos más generales, en R" con el producto interior euclidiano, la base estándar
e , =(1,0,0, . . . , O), e 2 = ( 0 , 1,0, . . . , O),
. . . , e,=(0,0,0, . . . , 1)
es ortonormal.
COORDENADAS
RELATIVAS A
BASES
ORTONORMALES
El interés de encontrar bases ortonormales para espacios con producto interior es
motivada en parte porel siguiente teorema, que muestra cuán excepcionalmente
sencillo es expresar un
vector en términos de una base ortonomal.
u = (u, V , > V l
Demostracion.
presar como
+ (u, v& + . . . + (u,v,)v,
Como S = {vl, v2, . . . , v n > es una base, un vector u se puede ex-
La demostración se completará probando que k,
Para todo vector vi en S se tiene
=
(u, vi) para i = 1, 2, . . . , n.
6.3 Bases ortonormales; proceso de Gram-Schmidt; descomposición QR / 369
(u, V i ) = (k,v, + k2V2 + . . . + kv,, V i >
= k,(v,, v,)+ k2(v2, vi) + . . . + k,,(v,, v,)
Como S = {vl, v2, . . . , v,,} es un conjunto ortonormal, se tiene
(v,, vi) = llv,l12= 1
(v,, vi) = 0
y
ifj#z
Por consiguiente, la expresión anterior para (u, vi) se simpllfica a
Usando la terminología y la notación presentadas en la sección 5.4, los escalares
(u, v,), (u,
v,), . . , (u, vn>
f
en el teorema 6.3.1 son las coordenadas de u con respecto a la base ortonormal S =
{VI' V2' . .
Vn>Y
' i
(u)s = ((u, VI ), (u, v,), .
' '
, (u, vn))
es el vector de coordenadas de u con respecto aesta base.
Ejemplo 3 Sean
VI
=(O, 1, O),
v2 = ( - 4 57
o
9
3
51,
v3 = (& o, 6,
Es fácil comprobar que S = {vl, vz, v3} es una base ortonormal para R3 con el producto interior euclidiano. Expresar el vector u = (1, 1, 1) como una combinación
lineal de los vectores en S y hallar el vector de coordenadas (u),.
Solución.
Por consigmente, debido al teorema 6.3.1, setiene
u = V I -kv,
+ %v3
es decir,
OBSERVACI~N. La utilidad del teorema 6.3.1 debe resultar evidente a partir de
este ejemplo si se considera que para bases no ortonormales suele ser necesario
resolver un sistema de ecuaciones a fin de expresar un vector en términos de la
base.
Las bases oflonormales para espacios con productointerior son Convenientes
porque, C O I ~ Ose muestra en e i siguiente teorema. muchas fórmulas conocidas se
cumplen para csas bases
~~~~
~
La demostración se deja para los ejercicios
N6tese que el miembro derecho de la igualdad en el inciso a) es
la norma delvectorde
coordenadas ( u ) ~conrespecto al producto interior
ewclidiano sobre H",y que el miembro derecho de la igualdad en el inciso c) es el
. trabajando con bases ortonormales.
producto interior euclidiano de (u), y ( v ) ~Así,
el cálculo de normas y productos interiores generales se puede reducir al cálculo
de normas y productos interiores euclidianos de los vectores de coordenadas.
OBSERVXCIQN.
Ejemplo 4 Si R' tieneelproducto
vector u = ( I , 1, 1) es
I/u//= (u u)
interior euclidiano, entonces la normadel
'1, d m = \ , ?
Sin embargo, si se hace que R' tenga la base ortonormal S del ejemplo anterior,
entonces por ese ejemplo se sabe que el vector de coordenadas de u con respecto a
S es
(a),5
=(1
1
"X,
k)
Ea norma de u también se puede calcular a partir de este vector usando el inciso a )
del teorema 6.3.2. Así, se obtiene
COORDENADAS
RELATIVAS A
BASES
ORTOGONALES
Si S = ( v l . va. . . . . vn) es unabase ortogonu1 para un espacio vectorial V.
entonces al normalizar cada uno de sus vectores se obtiene la base ortonormal
6.3 Bases ortonormales; proceso de Gram-Schmidt; descomposición QR / 371
Así, si u es cualquier vector en V, por el teorema 6.3.1 se concluye que
que, debido al inciso c) del teorema 6. l .1 se puede volvera escribir como
Esta fórmula expresa u como una combinación lineal de los vectores en la base
ortogonal S. En los ejercicios se dan algunos problemas que requieren el empleo
de esta fórmula.
Es evidente que si v,, vz y v3 son tres vectores diferentes de cero mutuamente perpendiculares en R3, entonces ninguno de los vectores está en el mismo
plano que los otros dos; es decir, los vectores son linealmente independientes. El
siguiente teorema generaliza este resultado.
Teorema 6.3.3. Si 5' = (v,, v,, . . . , v,) es un conjunto ortogonal de vectores no
nulos en un espacio
conproductointerior,entonces
S es linealmente
independiente.
Demostración.
Supóngase que
k , ~ +, k2vz
+
I
..
+ k,v,
(2)
=O
Para demostrar que S = (vl, v2, . . . , vn} es linealmente independiente, es necesario probar que k , = k, = . . = k, = O.
Para todo vi en S, por (2) se concluye que
'
(k,v, + k2v2+ . . . + k,v,, v,) = ( O , v,)
=O
o, de manera equivalente,
Por la ortogonalidad de S se concluye que <vi, vi> = O cuando j
esta ecuación se reduce a
f
i, de modo que
k,(v,, V I ) = O
Como se supone que los vectores en S son diferentes de cero, entonces <(¡, vi) f O
por el axioma de positividad en la definición de producto interior. Por consiguiente, k , = O. Como el subíndice i es arbitrario, se tiene k , = k, = . . . = kn = O;
así, S es linealmente independiente. 0
3 72
I
Espacios con producto interior
Ejemplo 5 En el ejemplo 2 se demostró que los vectores
forman un conjunto ortonormal con respecto al producto interior euclidiano sobre
R3. Por el teorema 6 . 3 . 3 , estosvectores forman un conjunto linealmente independiente, y como R3 es tridimensional, entonces por el teorema 5.4.6a se tiene
que S = {vI.v2, v3} es una base ortonormal para R3. A
PROYECCIONES
ORTOGONALES
A continuación se desarrollarán algunos resultados que serán de utilidad para obtener bases ortogonales y bases ortonormales para espacios con producto interior.
En R2 o R3 conel producto interior euclidiano, geométricamente resulta
obvio que si W es una recta o un plano que pasa por el origen, entonces todo vector
u en el espacio se puedeexpresar como UM suma
u = w,
+ w2
donde w1 está en W y w2 es perpendicular a W (figura 1). Este resultado es un caso
especial del sigwente teorema general cuya demostración
se da a final de esta sección
r
~~~
~~~~
~
Teorema 6.3.4. (Teorema de proyección). Si W es un subespacio de dimensión
j n i t a en un espacio V con producto interior, entonces todo vector u en V se
puede expresar de manera única como
u=w,+w,
donde w I está en W y w2 está en W L .
El vector w en el teorema precedente se denomina proyección ortogonal de
u sobre W y se denota por proy, u. El vector w2 se denomina componente de u
ortogonal a W y se denota por proywl u. Así, la fórmula (3) en el teorema de
proyección se puede expresar como
Como w2 = u - w se concluye que
6.3 Bases ortonormales; proceso de Gram-Schmidt; descomposicidn QR
I'
3 73
Figura 2
El siguiente teorema, cuya demostración se pide en los ejercicios, proporciona fórmulas para calcular proyecciones ortogonales.
I
6)
Si {vl, vz, . . . , vr} es una base ortogonal para W y u es cualquier vector
en V, entonces
Ejemplo 6 Sea R3 conelproducto interior euclidiano, y sea W elsubespacio
Por (6), la
generado por los vectores ortonormales v1 = (O, 1, O) y vz = (-+,O,$).
proyección ortogonal de u = (1, 1, 1) sobre W es
ProY
+ (u, v2)v2
= (1)(0. 1, 0) + (-6)(-9, o, g)
u = (u, v, )v,
-("
25,
1
"&
3
25)
La componente de u ortogonal a W es
proy,, u = u -proy,.u
=
(1, 1, 1) - (&, 1,
--&) = (+&,t?, gj
ObsCrvese que p r o y p u es ortogonal tanto a vi comoa v2, de modo que este
vector es ortogonal a todo vector en el espacio W generado por v1 y v2, como debe
ser. A
374
/’
Espacios con productointerior
DETERMINASe
ha
CIÓN DE BASES
ORTOGONALES
Y BASES
ORTONORMALES
visto que las bases ortonormales poseen varias propiedades útiles. El
siguiente teorema, que es el resultado principal de esta sección, muestra que todo
espacio vectorial no nulo y de dimensión finita tiene una base ortonormal. La demostración de este resultado es muy importante, ya que proporciona un algoritmo, o método, para convertir una base arbitraria en una base ortonormal.
~~
~~~~
~~~
Teorema 6.3.6. Todo espacio no nulo de dimensión finita con producto interior tiene una base ortonormal.
Demostración. Sea T’ cualquier espacio no nulo de hmensión finita con producto interior, y sea (u1, u2. . . . , un} cualquier base de V. Basta demostrar que Y
tiene una base ortogonal, ya que los vectores enla base ortogonal se pueden
normalizar a fin de obtener una base ortonormal para V. La siguiente serie de
pasos produce una base ortogonal {vl, v2, . . . , v,} para V
Paso 1. Sea v1 = ul.
Paso 2. Como se ilustra en la figura 3, se puede obtener un vector v2 que sea
ortogonal a vI calculando la componente de u2 que sea ortogonal al espacio Wl generado por vl. Se aplica la fórmula (7):
/
v2= u2 - proyw, u2 = u2-
\
(U2’VI)
V
l 1I2
Por supuesto, si vz = O, entonces v2 no es un vector básico. Pero ést0 no
puede suceder, ya que por
la fórmula precedente para
v2 se concluiría que
la cual establece que u2 es un múltiplo de ul, contradiciendo la independencia lineal de la base S = {u1, u2,. . . , U,,).
Paso 3. Para obtener un vector v3 que sea ortogonal tanto a v, como a v2, se
calcula la componente de u3 ortogonal al espacio W2 generado por v1 y
v2 (figura 4). Por (7),
v3= u3 - proyw, u3 = ug - (u3’v1) vl-
IF112
(u3’v2) v2
P2u2
Como en el paso 2, la independencia lineal de u l , u2, . . . , u, asegura
que v3 # O. Los detalles se dejan como ejercicio.
Paso 4. Para determinar un vector v4 que sea ortogonal a v,, v2 y v3, se calcula
la componente de u4 ortogonal al espacio W3 generado por v l , v2 y vj.
Por (71,
6.3 Bases ortonormales; proceso de Gram-Schmidt; descomposición QR /I 3 75
v4= u4- proyw u4 = u4-
v2 -
3
'
Figura 4
Continuando deesta manera. despuésde n pasos se obtiene un conjunto
ortogonal de vectores, {vl, v2, . . . , vn). Como la dimensión de V e s I? y todo conjunto ortogonal es linealmente independiente, el conjunto ( v l , v2, . . . , vn} es una
base ortogonal para V. 0
La construcción precedente paso a paso para convertir una base cualesquiera
en una base ortogonal se denomina proceso de Gram-Schmidt*(página 376).
Ejemplo 7 Considérese el espacio vectorialR3 con el producto interior euclidiano.
Aplicar el proceso de Gram-Schrmdt para transformar los vectores básicos u = (1,
1, l), u2 = (O, 1, 1) y u3 = (O, O, 1) en una base ortogonal { v l , v2, v3}; luego.
normalizar los vectores básicos ortogonales para obtener una base ortonormal { q
Q2.
q31.
Solución.
3 76
Espacios con producto interior
Paso 3. v3= u3 - proyw, u3 = u3= (0,
o,
1) -
(U3'vl)
P12
(u3'y2)
P2I2
f (1, 1, 1) = # [--$+,*)
Así,
2' 2
forma unabase ortogonal para R3. Las normas de estos vectores son
de modo que una base ortonormal para R3 es
*Jiirgen Pederson G r m (189-1916) h e un actuario dank.Recibió su primera instmw5ón en escuelas pubhcas,
Despub de terminar el bachillerato obtuvo lamaestría en makmáticas con
complementada con tutores particulares.
apecializacion en álgebra modema, que estaba en pleno &sa~~ollo.
Gram trabajó & p ~ & como actuario para la
H&a Lifi Insurance Company, dondedesa~rollól o s cimientos matemálicosde los seguros contra accjdemte para la
compañía Skjold Fue miembro de la junta d i v a de H&a y dirigió la conpñía Skjold basa 1910, cuando se
convirtió en directordela Danish Insurance bard Durante el tiempo que trabajó como actuario obtuvoel
Doctorado en Filosofia con base en su tesis "On Serie Development Utilizing the M Squares Method". Fue en
estatesis que plantaí por primera vezsus contribuciones alproceso de Gram-SchmidtC m terminb por interesarse
en teoría ab&acta de okmeros y h e galardonado con la medalla deoro concedida por la Royal Danish Society of
Scienca and L , e t í a s debido aSILS investigacionesen ese c a m p . Sin embargo, durante toda su vida también mantuvo
un interés sobre la interacción entre a
ls maiemáticas teinicas y a
ls matemáticas aplicadas, cuyo resuitado fueron
cuatro tratados sobre administracón de bosques daneses. Gram falleció una tarde enun choque en bicicleta cuando
se dirigía una
a reunión de laRoyal Danish Society.
*ErhmdtSchmidt(1876-1959) h e un m a k d c o alemán. En 1905 Schmidt recibió su grado de doctor en la
universidad de Gotinga, donde estudió bajo la asesoría de uno de los grandes matemáticos: David Hilbert En 1917
decidió S a dar clases en la Univasidad de krlín, ciudad en la que permaneció por el resto de su vida Schmidt
realizó importanks contribuciones avarios campos makmáticos, pero es más conocido por haber *pado
muchas
ls ideas dispersas de Hilbert en un concepto general (denominado espacio de Hilbert), que es iündamzntal en el
dea
estudio de espacios vedonales de dimensión idmita. Schmidt dsrribió por primera vez el proceso que lleva
su
nombre enun articulo sobre ecuaciones integrales publicado en 1907.
6.3 Bases ortonormales; proceso de Gram-Schmidt; descomposición QR 1 377
OBSERVACI~N. En elejemplo precedente se usó el procesodeGram-Schmidt
para obtener una base ortogonal; luego, una vez que se obtuvola base ortogonal, se
normalizó para obtener una base ortonormal. De otra manera, es posible normalizar cada vector básico de la base ortogonal en cuanto se obtiene generando,
así, paso a paso la base ortonormal. Sin embargo, este método presenta la ligera
desventaja de producir más raíces cuadradas que manejar.
El proceso de Gram-Schmidt con normalización ulterior no sólo convierte una
base cualesquiera{ u 1 , ~2,
. . . , U,} en una base ortonormal {Sl, q,, . . . , q,}, sino que
también lo hace de modo que para k 2 2 se cumplan las siguientes relaciones:
{ q,, q,, . . . , qk} es una base ortonormal para el espacio generado por {u1,
Up
...>
Uk}.
qk es ortogonal a { u l , u 2 , . . . , U k - l } .
Se omiten las demostraciones, pero estos hechos debenser evidentes después de un
análisis profundo de lademostración del teorema 6.3.6.
DESCOMPOSICIÓN QR
Se plantea el siguiente problema.
Problema. Si A es una matriz m X n con vectores columna linealmente independientes, y si Q es la matriz con vectores columna ortonormales que se
obtienen al aplicar el proceso de Gram-Schdt a los vectores columna de A ,
¿qué relación, en caso de haber alguna, existe entre A y Q?
Para resolver este problema, supóngase que los vectores columnaA de
son ul, %,
. . . , u,,
y que los vectores columna ortonormales de
Q son q,, q2, . . . , 9,; así,
A=[ul I
u2
I '.. I
y
U,]
Q=[q, 1
92
I ' . . I S,]
Por el teorema 6.3.1 se concluye que ul, u,, . . . , u, se pueden expresar en términos de q,, q,, . . . , q, como
u2 = ( U 2 > 91)91
+ (u23
'..+
q,)q,
92h2 +
+ ( u 2 , q,h,
u,
+ (u,,
q2h2
u1 = ( U I > q,)q, + ( U I > 9 2 h 2 +
= ( u n ,q1)91
(u13
' ' '
+ . . . + ( u , , q,)q,
Recordando de la sección 1.3 que el j-ésimo vector columna de un producto de
matrices es una combinación lineal de los vectores columna del primer factor con
coeficientes provenientes de laj-ésimacolumna de segundo factor, se concluye que
estas relaciones se pueden expresar en forma matricial como
3 78 1 Espacios con producto interior
o, más brevemente, como
Sin embargo, una propiedad del proceso de Gram-Schmidt es que paraj 2 2, el
vector qj es ortogonal a ul, u*, . . . , u.. así, los elementos abajo de la diagonal
J 1'
principal de R son cero.
Se deja como ejercicio demostrar que los elementos dela diagonal de R son
diferentes de cero, de modo que R es invertible. Así, (S) es una factorización de A
en el producto de una matriz Q con vectores columna ortonormales y una matriz
triangular superior invertible R. La expresión (8) se denomina descomposición
QR de A . En resumen, se tiene el siguiente teorema.
Teorema 6.3.7. (Descomposición QR). Si A es una matriz m X n con vectores
columna linealmente independientes, entonces A se puede factorizar como
A
= QR
donde Q es una matriz m X n con vectores columna ortonormales y R es una
matriz triangular superior invertible n X n.
Recuérdese por el teorema 6.2.7 que si A es una matriz n x n,
entonces la invertibilidad de A equivale a la independencia lineal de los vectores
columna; así, toda matriz invertible posee una descomposición QR.
OBSERVACI~N.
E.jemplo 8 Encontrar la descomposición QR de
Solución. Los vectores columna de A son
Aplicando el proceso deGram-Schmidt con normalización ulterior a estos vectores
columna se obtienen los vectores ortonormales (véase el ejemplo7)
6.3 Bases ortonormales; proceso de Gram-Schmidt: descomposición QR / 3 79
y por (9), la matriz R es
A
FUNCIÓN DE LA
DESCOMPOSICIÓN QR EN
ÁLGEBRA
LINEAL
En años recientes, la descomposición QR ha adquirido una importancia cada vez
mayor como fundamento matemático de una amplia gama de algoritmos numéricos prácticos, incluyendo un algoritmo bastante usado para calcular eigenvalores
de matrices grandes. Los algoritmos se analizan en libros de texto relacionados con
los métodos numéricos del álgebra lineal.
DEMOSTRACI~NADICIONAL
Demostración del teorema 6.3.4. La demostración se efectúa en dos partes.
Primero es necesario encontrar vectores w1 y w2 con las propiedades enunciadas y
luego demostrar que estos vectores son únicos.
Por el proceso de Gram-Schmidt, existe una base ortonormal { v l , v2, . . . ,
vn} para W. Sean
W ] = (u, V I b ,
+ (u, v2)v2 + ' . . + (u, v,)v,
(10)
Y
w2=u-w1
(11)
Se concluye que w1 + w2 = w1 + (u - wl) = u, de modo que queda por demostrar
que w1 está en W y que w2 es ortogonal a W. Pero w1 está en W porque es una
combinación lineal de los vectoresbásicos para W. Para demostrar que w2 es
ortogonal a W es necesario probar que (wz, w) = O para todo vector w en W. Pero
si w es cualquier vector en W, se puede expresar como una combinación lineal
w = k,v,
+ k2v2 + . . . + knvn
380
./
Espacios con producto interior
de los vectores básicos v, v2, . . . , v,. Así,
(w2, W ) = ( U - w,,W ) = ( U , W ) - {w].w j
Pero
(u, w) = (U, k , ~ +
, k2v2+ . . . f k , ~ , , )
= k!(U, VI>
+ k2(U,
v2)
+
‘
..
+ k,(U, Vil)
y por el inciso c) del teorema 6.3.2
(w,,
= (u,
w)v , )k,
+ (u. v2)k, +
’ ’ ’
+ (u, v,)k,
Así, (u, w} y (wl, w) son iguales, de modo que (12) produce (w2, w) = O, que es lo
que quería probarse.
Para ver que (IO) y (11) son los únicos vectores con las propiedades enunciadas en el teorema, supóngase que también es posible escribir
donde w i está en W y w i .es ortogonal a W. Si de (13) se resta la ecuación
u=w,+w,
se obtiene
o = (w;
-
o bien,
wl)
+ (w;- w2)
w1- w;= w; - w?
(14)
Como w2 y wi son ortogonales a W, su diferencia también es ortogonal a W, ya
que para cualquier vector w en W se puede escribir
(w,w; - w2>= (w,w;) - (w,w2) = o - 0 = o
Pero w; - w2 es un vector en W. ya que por (14) es la diferencia de los dos
vectores w1 y W; que están en el subespacio W. Así, w; - w2 debe ser ortogonal a
sí mismo; es decir,
(w;
-
w2,
w; - w2) = o
Pero esto significa que w i - w2 = O por el axioma 4 en la definición de producto
interior. Así, w; = w2 y, por (14), w; = w l . O
EJERCICIOS DE LA SECCION 6.3
1. ¿Cuáles de los siguientes conjuntos de vectores son ortogonales con respecto al pro-
ducto interior euclidiano sobre R2?
6.3 Bases ortonormales;proceso de Gram-Schmidt; descomposición QR 1 381
a) (0,I). (2,O)
C) ( - I/\‘%
-
b) ( - l/V% I / f i ) ,
I / f i ) , (l/V‘Z l / d ? )
l / d )
d) (0,O). (O, 1)
2. ¿Cuáles delos conjuntos del ejercicio 1 son ortonormales con respecto al producto
interior euclidiano sobre R2?
3. ¿Cuáles de los siguientes conjuntos de vectores son ortogonales con respecto al pro-
ducto interior euclidiano sobre R3?
4. ¿Cuáles de los conjuntos del ejercicio 3 son ortononnales con respecto al producto
interior euclidiano sobre R3?
5. ¿Cuáles de los siguientes conjuntos de polinomios son ortononnales con respecto al
producto interior sobre P2 que se analizó en el ejemplo 8 de la sección 6. l ?
I
1
a) $ - f x + + x 2 , $ + Q x - $ x ’ ,
+ -x2,
v5v5
b) 1 , -x
$+$x+$x2
x2
6. ¿Cuáles de los siguientes conjuntos de matrices son ortononnales con respecto al producto interior sobre M22que se analizó en el ejemplo 7 de la sección 6. l?
a)
b,
[:, 3 [; -4 [-: !]> [:!]
[;
[bi [P PI. [Y -;I
3
5
3
5
7. Comprobar que el conjunto de vectores dado es ortogonal con respecto al producto interior euclidiano; luego, normalizando los vectores convertirlo en un conjunto ortonormal.
a) ( - 1, 21, (6, 3)
b)
-11, (2, 0, 21, (0, 5, 0)
C) (i
&,
i),
( - f , b O), ($,$, - f )
Demostrar que {x, y}es ortononnal sí R2 tiene el producto interior (u, v) = 3u,vl
+
2u2v2, pero que no es ortononnal sí R2 tiene el producto interior euclidiano.
9. Comprobar que los vectores v, = (-+,4,0),v2 =($,$,O ), v2
=
(O, O , 1)foman una
base ortonomal para R3 con el producto interior euclidiano; luego, mediante el teorema 6.3.1, expresar cada uno de los siguientes vectores como una combinación lineal
de V , ’ v2 Y v3.
a) (1, - 1, 2)
b) (3, - 7 , 4)
C) (+, -%$I
10. Comprobar que los vectores
VI=(^, -1323 -11,
~ , = ( - 2 , 2 , 3 , 2 ) ,v , = ( l , 2 , 0 ,
-I),
v,=(I,O,O,
1)
3817
1
Espacios con producto interior
11.
12. Sea I? con el producto interior euclidiano, y sea S =
w = (++j , w 2 = (5.4)
> >
a)l Deternlinar los vectores u y
{MI ,
w?]la base ortonormal con
v cuyos vectores de coordenadas son (u), = (1, 1) y (v),
=(-1,4).
b) Calcular Ilull, d(u. v) y {u, v) aplicando e1 teorema 6.3.2 a los vectores de coordenadas
(u), y (v)& luego, comprobar los resultados mediante cálculos directos sobre u y v.
13. Sea H' con el producto interior euclidimo, y sea S = {w),
w,, w3}la base ortononnal
4 3
IV, = (1, O, 0 ) y w3= (O,y,y).
con w,= (O, - ((),-I,*),
' I F
'.
a ) Encontrar los vectores u, v y w cuyos vectores de coordenadas son (u), = (-2, 1, 2),
(v), = (3, o, - 2 ) v (w), = ( S , -4, 1).
b) Calcular 11~11, d(u, W) y (w,v} aplicando el teorema 6.3.2 a los vectores de coordenadas ( u ) , (v).~y (w)& luego, comprobar los resultados mediante cálculos directos
sobre u y v.
14. En cada inciso, S representa alguna base
ortotlorma1 de u11 espacio tetradimensional
con producto interior IJsar l a información que se proporciona para encontrar IIuII, IIv WII, IIv + w11 Y (v, w).
a) (u), = ( - 1. 2, I , 3 ) , (vjS = (0, - 3 , I , 5), ( w ) =
~ ( - 2. - 4. 3, 1)
b) (U), = (O. O. - 1. - l ) , (v),,= (5, 5. - 2, -2). (w),,
= (3, O. " 3 . O)
IS. a) Demostrar que los vectoresv, = (1, -2, 3, -4), v2 = (2. I, -4, -3), Y? = (-3, 4, I ,
-2) y v4 = (4, 3, 2, I foinan una base ortogonal para R;' con el piducto kt&or
cuclidlano.
b) Usando ( 1 ), expresar u = (- 1,2,3, 7 ) como una conlbinaclón lineal de los vectores
cn el inciso a).
16. Sea R2 con el producto interior euclidiano. Usando el proceso de Gram-Schmidt, transfonnar Is base (u,, u2} en una base ortonormal.
a! u , = ( I . -3L u 2 = ( 2 . 2 )
b) u , = ( l . O ) , u 2 = ( 3 . - 5 )
17. Sea H'
con el producto interior euclidiano. Con el proceso de Gram-Schmidt, transformar la base { u I .u,, u3}en una base ortononnal.
a) u , = ( 1 , I , I ) , u Z = ( - 1 , 1.0). u,=(1,2. I )
b ) u , = ( I . O , O ) . ~ 2 = ( - 3 , 7 ,-2). u ; = ( O . ~ . I )
18. Sea R4 con el producto interior euclidiano. Usando el proceso de Gram-Schmidt, transformar la base {u1,u,, u3, u4} en una base ortononnal
6.3 Bases ortonormales; proceso de Gram-Schmidt; descomposición QR / 383
u,=(O,2,1,0), & = ( I ,
-1,O,O),
u 3 - ( l , 2 , O-, l )u, 4 = ( 1 , 0 , 0 , 1 )
19. Sea R3 con el producto interior euclidiano. Encontrar unabase ortonormal para el
subespaciogeneradopor(0, 1,2),(-1,0, l)y(-1, 1,3).
20. Sea R3 conelproducto interior u, v = ulv! + 2u2v2+ 3u3v3.Con elproceso de GramSchrmdt,transformarul=(1,1,1),~=(1,1,0),~=(1,0,O)enunabaseortonormal.
21. El subespacio de R3 generado por los vectores u1 = (+,O,-+)
y u2 = (O, 1, O) es un
plano que pasa por el origen. Expresar w = (1,2, 3 ) en la forma w = w I + w2, donde w1
está en el plano y w2 es perpendicular al plano.
22. Repetir el ejercicio 21 con u1 = (1, 1, 1) y u2 = (2, O,
- 1).
con el producto interior euclidiano. Expresar w = (- I , 2, 6, O) en la fonna w =
wl+w,,dondewlestáenelespacioWgeneradoporul=(-1,O,1,2)yu2=(O,1,O,
I), y w2 es ortogonal a W.
23. Sea
24. Encontrar la descomposición QR de la matnz
a)
[: -:I
1 0 2
1 2 0
1
2
1
1
-1
1
o 3 1
O[
-1
0
1
1
1
0
1
1
1
25. Sea {vI, v2, v3) una base ortonormal para un espacio V con producto interior. Demos-
trar que si w es un vector en V, entonces llw112 = (w, v1)2+ (w, v2)2+ (w, v ~ ) ~ .
26. Sea {vl, v2,. . . , vn} una base ortonormal de un espacio Vcon producto interior. Demostrar que si w es un vector en Y, entonces llw112 = (w, vl)' + (w, vJ2 + . . . + (w, v ~ ) ~ .
27. En el paso 3 de la demostración del teorema 6.3.6, se afirmó que "la independencia lineal de {u1,u*,.. . , u,,}asegura que v3 # O". Demostrar esta afirmación.
28. Demostrar que los elementos en la diagonal de R en la fórmula (9) son difaentes de cero.
Aplicando el proceso de Gram-Schmidt, transformar la base estándar S = { I , x, 2)en
una base ortonormal. (Los polinomios en la base resultante son los tres primeros polinomios normalizados de Legendre.)
381 ' Espacios con producto interior
30. (Para quienes y a estudiaron Crslculo). llsando el teorema 6.3.1, expresar los siguientes polinomios como una combinación lineal de los tres polinomios normalizados
de Legendre (ejercicio 29).
a) I + x + 4x4.
b) 2 - 7x2
c) 4 + 3x.
31. (Para quienes y a estudiaron Crslculo).Sea P 2 con el producto interior
c'
( P , 4)= J,
P(X)Y(X)
&
Aplicando el proceso de Gram-Schmidt, transformar l a base estándar S = { 1, x, 2)en
una base ortonomal
32. Demostrar el teorema 6.3.5
33. Demostrar el teorema 6 . 3 . 2 ~
34. Demostrar el teorema 6.3.26.
35. Demostrar el teorema 6 . 3 . 2 ~
6.4 MEJOR APROXIMACIóN; MíNIMOS CUADRADOS
En esta sección se mostrara la manera de utilizar las proyecciones ortogonales
para resolver ciertos problemas de aproximación. Los resultados obtenidos en
esta sección titnen aplicaciones diversas tantoen matemáticas como en ciencias.
PROYECCIONES
ORTOGONALES
CONSIDERADAS
COMO
APROXIMACIONES
Si P es un punto en el espacio tridimensional ordinario y W es un plano que pasa
por el origen, entonces el punto Q en W más próximo a P se ob-tiene
al trazar una
perpendicular de P a W (figura la). Por tanto, si se hace u = UP, la &stancia entre
P y Westá definida por
l b - PO' Y,
UII
En otras palabras, de todos los vectores w en W, el vector w = proy, u minimiza la
distancia IIu - wll (figura lb).
(It
Figura 1
Q es el punto en N más próximo a P.
h)
11u - wli es minimizada por w = proywu.
6.4 Mejor aproximación; mínimos cuadrados / 385
Hay otra forma de pensar esta idea. Considerar que u es un vector fijo cuya
aproximación se desea obtener por medio de un vector en W. Cualquier aproximación w de este tipo dará por resultado un "vector de error"
u-w
el cual, a menos de que u esté en W, no se puede hacer igual a O . Sin embargo,
eligiendo
w =proyw u
es posible hacer que la longtud del vector de error
Ilu - wll
=
l b - ProY,
UII
sea tan pequeña como se quiera. Así, w = proy, u se puede describir como la
''mejor aproximación" para u por medio de vectores en W. El siguiente teorema
precisará estas ideas intuitivas.
Teorema 6.4.1. (Teorema de la mejor aproximación). Si W es un subespacio
de dimensión j n i t a de un espacio V con producto interior, y si u es un vector
en V, entonces proy, u es la mejor aproximaciónpara u desde W en el sentido
de que
Ilu -ProY,
UII
<1111
- WII
para todo vector w en W diferente de proy, u.
Demostración.
Para todo vector w en W se puede escribir
u - w = (u -proyw u) + (proy, u - w)
(1)
Pero proyw u - w, por ser una diferencia de vectores en W, está en W, y u proy, u es ortogonal a W, de modo que los dos términos en el miembro derecho de
(1) son ortogonales. Así, por el teorema de Pitágoras (teorema 6.2.4),
Ilu - wl12 = 11u -pray, u1I2 + Ilproy~u - w1I2
si w
que
f
proyw u, entonces el segundo término de esta suma es positivo, de modo
o, de manera equivalente,
11u - WII > 11u - pray, 4
1
o
Después, se proporcionarán aplicaciones de este teorema.
386 , Espacios con producto interior
SOLUCIóN DE
SISTEMAS
LZNEALES POR
MÍNLMOS
CUADMDQS
Hasta ahora se han tratado principalmente sistenlas de ecuciones lineales consistentes.
Sin embargo. los sistemas lineales inconsistentes también son importantes en
aplicaciones fisicas. Una situación común es que algún problema fisico conduzca a un
sistema 'lincal A x = b quedesde un punto de vista teórico debeser consistente.
aunqueno lo es debido a que"erroresdemedición"en
los elementosde A y b
perturban bastante al sisten~a parahacerlo inconsistente. E n situaciones como éstas se
brlsca un valor de x que esté "Io n h próximo posible" de ser una solución en el sentido
de que redczca el valor de jbgx = bll con respecto al producto interior euclidiano.
Lacantidad Ib4x = bll se puedeconsiderarcomounamedidadel"error"que
resulta al considerar a x como una solucibn aproximada del sistema lineal A x = b.
Si el sistema es consistente y x es una solución exacta, entonces el error es cero. ya
que (PIX -= bjl 1 1 0 1 1 = O. En general, mientras más grande sea el valor de 1c4x =
bjl, mas deficiente será la aproximación de x a una solución del sistema.
~
Problema de mínimos cuadrados. Dado un sistema lineal A x
~
~~
~
~~~~~~~
b de m ecuaciones con 17 incógnitas. encontrar un vcctor x. si es posible. que reduzca a 1C.l~
= $11 con rcspcct~a
l producto interioreuclidiano sobre I?'". El \rector se
denomina solucibn por mínimos cuadrudos de A x = b.
o f u m < \ ~ . % < * H h ~Para
sea e
7-
..I x
-
comprender el origcn dc la expresión t~inirnosc!mlrudos.
ir. que se puede considerar como un hector de error que se obtiene de
la aprosinmcim x. Si e
cu;i&ados
+P
=
r n m i n u m a llell
.
=
( e , . e2.
=- ( ~ f t e $
.
. c,,~),entonces una soluciónpor minimos
)?I
1 por tanto, también m i n i m i a a
t . . t e 2 de donde proviene la cspresión r n i m m m cuadrdoa.
t71
Para resolver e1 problema de mínimos cuadrados, sea I f ' el espacio columI-ta
de A
. Para todanlatri/: n X 1 . el producto - { X es una combinación lineal de los
xzcctorcs crrlunrna dc ..! h i . cuando x \,aria sobre !?n. el vector .'Zx varía sobre
todas las combinacroncs 1:nealcs posibles dc los \'cctorcs columna de ;1; es decir.
. la \.aria sobrc lodo cl cspacio columna il'.Geométricamente, resolver el problema
dc mínimos cuadrados equivale a encontrar u11 vector S en R n tal que <.lx sea el
Lector CPI i f . m i s prbxiino a b ( f i g m 2).
cf
-:-
Una solucicin por mínimos cuadrados x produce el
m i s próximo a b.
Por el teorema de la mejor aproximación (teorema 6.4.1) se concluye que el
vector en W mis próximo a b es la proyección ortogonal de b sobre M.'. Así, para
6.4 Mejor aproximación, mínimos cuadrados /’ 387
que un vector x sea una solución por mínimos cuadrados de Ax = b, este vector
debe satisfacer
(2)
Ax = proy, b
Se podría intentar determinar soluciones por mínimos cuadrados de Ax = b
calculando primero el vector proyw b y luego resolviendo (2); sin embargo, existe
un método mejor:Por el teorema de proyección(teorema 6.3.4)y la fórmula (5) de
la sección 6.3 se concluye que
b - A x = b -proywb
es ortogonal a W. Pero W es el espacio columna de A , de modo que por el teorema
6.2.6 se concluye que b - Ax está en el espacio nulo de A T . Por consiguiente, una
solución por mínimos cuadrados de Ax = b debe satisfacer
ATx(b - A X )= O
o, de manera equivalente,
ATAx = ATb
(3)
Esta expresión se denomina sistema normal asociado conAx = b y las ecuaciones
individuales se denominan ecuaciones normales asociadas con Ax = b. Así, el
problema de hallar una solución por mínimos cuadrados de Ax = b se ha reducido
al problema de encontrar una solución exacta del sistema normal asociado.
Nótense las siguientes observaciones sobre elsistema normal:
En el sistema normal hay n ecuaciones con n incógnitas (comprobar).
El sistema normal es consistente, ya que se satisface con una solución por
mínimos cuadrados de Ax = b.
El sistema normal puede tener infinidad de soluciones, en cuyo caso todas éstas son soluciones por mínimos cuadrados de Ax = b.
Con base en estas observaciones y la fórmula (2) se tiene el siguiente teorema.
Teorema 6.4.2. Para cualquier sistema lineal Ax
=
b, el sistema normal aso-
ciado
ATAx = ATb
es consistenle y todas las soluciones del sistema normal son soluciones por
mínimos cuadrados de Ax= b. Además, si W es el espacio columna de A y x es
cualquier solución por mínimos cuadrados de Ax = b, entonces la pro-yección
ortogonal de b sobre W es
proy, b = A x
UNICIDAD
DE LAS
SOLUCIONES
POR M~NIMOS
CUADRADOS
Antes de ardizar algunos ejemplos numéricos, se establecerán condiciones que
garantizan que un sistema lineal tiene sólo una solución por mínimos cuadrados.
Sc nccesitari el siguienic tcorema
Teorema 6.4.3. S'¡ '4 es una matriz tt1
nes son equivalentf~s.
X
n, entonces las siguientes proposicio-
c ) A tiene vectores columna linealmente independientes
d) ATA es invertible.
llerrmsfracicin.
Se demostrará que a 3 h y h
3
a.
a
3 h : Supóngase que los vectores columna de A son linealmente independientes.
La matriz A',I es de tamaño n x n, de modo que, para demostrar que esta matriz
cs invertible, sc debe probar que el sistema lineal A'Ax = O sólo tiene la solución
trivial. Pero si x es cualquier solución de este sistema, entonces A x está en el espacio nulo de A 7 'y también está en el espacio columna de A . Por el teorema 6.2.6
los espacios son complementos ortogonales. de modo que el inciso b) del teorenla
6.2.5 indica que A x = O . Pero -4 tiene vectores columna linealmente independientes. de modo que x = O por el teorema 5.6.8.
b 3 a : Supóngase que ATA es invertible. Para demostrar que A tiene vectores
columna linealmente independientes, por el teorema 5.6.8. basta probar que A x =
O sólo tiene la solución trivial. Pero si x es cualquier solución de A x = O , entonces
A ?,I x = A TO = O. de modo que x = O debido a la invertibilidad de A 'A. 0
El siguiente teorema es una consecuencia directa de los teoremas 6.4.2 y
6.4.3. Se omiten los detalles.
Teorema 6.4.1. (Unicidad de las soluciones por mínimos cuadrados). Si A es
una matriz 111 X n con vectores columna linealmente independientes, entonces
para toda tnatrrz b de n X 1 e l sistenm lineal A x = b frene una sola solucibn
por lt1íniv1o.s cundrados. E.sta solucicin est6 dada por
I
Las fórmulas (4) y ( 5 ) poseen varias aplicaciones teóricas, pero
no son eficaces para efectuar cálculos numéricos. Las soluciones por mínimos
cuadrados de A x = b se calculan mejor usando eliminación gaussiana o eliminación de Gauss-Jordan para resolver las ecuaciones normales: la proyección ortoORSERVACI~N.
6.4 Mejor aproximación, mínimos cuadrados
/'
389
gonal de L sobre el espacio columna de A se obtiene calculando Ax, donde x es la
solución por mínimos cuadrados de A x = b.
y encontrar la proyección ortogonal de b sobre el espacio columna de A
Solución. Aquí,
Obsérvese que A tiene vectores columna linealmente independientes, de modo que
de antemano se sabe que existe una solución por mínimos cuadrados única.
de modo que en este caso el sistema normal ATAx = A*b es
Resolviendo este sistema se obtiene la solución por mínimos cuadrados
Por ( 9 , la proyección ortogonal de b sobre el espacio columna de A es
Ejemplo 2 Encontrar la proyección ortogonal del vector u .= ("3,
el subespacio de R4 generado por los vectores
" 3 , 8, 9) sobrc
390 1 Espacios con producto interior
Solucidn. Para resolver este problema se aplica primero el procesode GramSchmidt con el fin de convertir { u l , u2, u3} en una base ortonormal y luego se
aplica el método usado en el ejemplo 6 de la sección 6.3. Sin embargo, el siguiente
método es mejor.
El subespacio W de R4 generado por u l , u2 y u3 es el espacio columna de la
matriz
-1
A = [ 3
o
2
1
-1
Entonces, si u se expresa como un vector columna, es posible determinar la proyección ortogonal de u sobre W encontrando una solución por mínimos cuadrados
del sistema A x = u y, luego, calculando proy, u = Ax a partir de la solución por
mínimos cuadrados. Los cálculos son como sigue: El sistema Ax = u es
3
1
O
1
de modo que
3
ATA=
1
[-1
ATu =
3
1
-1
1
2
0
1
O
2
1
2
0
0
1
2
3
1
"
1
i
O
I
1
-1
En este caso, el sistema normal ATAx = A
-4
11
6
-4
1
1
-3
-3
8
9
es
10
6
7
O
-4
0
6
6.4 Mejor aproximacibn, mínimos cuadrados
/
391
Resolviendo este sistema se obtiene que la solución por mínimos cuadrados de A x
= u es
(comprobarj, de modo que
o bien, en notación horizontal (lo cual es consistente con el planteamiento original
del problema), proy,u = (-2, 3, 4. O). A
OPERADORES
PROYECCIóN
ORTOGONAL
En la sección4.2 se analizaron algunos operadoresproyección ortogonal básicossobre
R2 y R3 (tablas 4 y 5 ). El concepto de operador proyección ortogonal se puede extender
a espaciosgeneralesconproductointeriorcomo
se muestraenseguida.
Definición. Si W es un subespacio de Rm. entonces la transformación P:Rm+
W que aplica cada vector x en Rm en su proyección ortogonal proy, x en W se
denomina proyección ortogonal de Rmsobre W.
Se deja como ejercicio demostrar que las proyecciones ortogonales son operadores
lineales. Por la fórmula (5) se concluye que la matriz estándar para la proyección
ortogonal de Rmsobre IV es
[ P 1 = A ( A 'A) ' 4 '
~
(6)
donde A se obtiene usando cualquier base para W como sus vectores columna
Ejemplo 3 En la tabla 5 de la sección 4.2 se demostró que la matriz estándar para
la proyección ortogonal de R3 sobre el plano xy es
Para darse cuenta de que lo anterior es consistente con la fórmula (6), considérense los vectores unitarios a lo largo de los ejes x y y positivos como base para el
plano xy, de modo que
A=
[ie]
392
3
Espacios con producto interior
Se deja para el lector comprobar que ATA es la matriz identidad 2 x 2; así, (6) se
simplifica a
[:
o
[P]-AAT=
:][I
1
0
O
1
o]=[:
0
o
0
"1
0
lo cual concuerda con (7). A
Ejemplo 4 Hallar la matriz estándar para la proyección ortogonal P de R2 sobre la
recta 1 que pasa por el origen y forma un ángulo 8 con el eje x positivo.
Solución. La recta I es un subespacio unidimensional de R2. Como se ilustra en
la figura 3, se puede tomar v = (cos 8 , sen 8 ) como una base para este subespacio,
de modo que
Se deja para el lector comprobar que ATA es la matriz identidad 1 x 1; así, (6) se
simplifica a
[ P I =AAT=
[i:::] [ cos e
,p
sen 6 1 =
1.
cos2 e
sen o COS e
sen e cos 6
sen2 8
[
7';
PIX)
1L
+
Figura 3
RESUMEN
El teorema 6.4.3 permite agregar un resultado adicional al teorema 6.2.7.
Teorema 6.4.5. Si A es una matriz n X n, y si TA:R" -+ R" es la multiplicación
por A , entonces las siguientes proposiciones son equivalentes.
a ) A es invertible.
b ) Ax = O sólo tiene la solución trivial.
c ) La forma escalonada reducida de A es I,,,
d) A puede escribirse como un producto de matrices elementales,
e ) Ax = b es consistente para toda matriz b n X 1,
f,l A H = b tiene exactamente una solución para toda matriz b n X 1.
g ) det(A) f O .
6.4 Mejor aproximación, mínimos cuadrados / 393
h) El rango de TA es R".
i) TA es uno a uno.
j ) Los vectores columna de A son linealmente independientes.
k) Los vectoresrenglón de A son linealmente independientes.
r) Los vectores columna deA generan a R".
m ) Los vectores renglón deA generan a R".
n ) Los vectores columnade A forman una base para R".
o ) Los vectores renglón de A forman una base para R".
p ) El rango de A es n.
q) La nulidad deA es O .
r ) El complemento ortogonal del espacio nulo de A es R".
S ) El complemento ortogonal del espacio renglón deA es (O).
t) ATA es invertible.
Este teorema relaciona los temas más importantes estudiados hasta el momento.
EJERCICIOS DE LA SECCIÓN 6.4
1. Hallar el sistema normal asociado conel sistema lineal dado.
2. En cada inciso, encontrar det(ATA)y aplicando el teorema 6.4.3, determinar si A tiene
vectores columna linealmente independientes.
3. Encontrar la solución por mínimos cuadrados del sistema lineal
Ax
= b y hallar la
proyección ortogonalde b sobre el espacio columna de A .
4. Determinar la proyección ortogonal de u sobre el subespacio de R3 generado por los
vectores v, y v2.
a) u = (2, 1, 3); v1 = (1, 1, O), v2 = (1, 2, 1)
b ) u = ( l , -6,l); ~,=(-1,2,1), v2=(2,2,4)
394 / Espacios con producto interior
5. Encontrar la proyección ortogonalde u sobre el subespacio de I? generado por los vectores v,, v2 y vj.
a) ~ = ( 6 , 3 , 9 , 6 ) ;~ , = ( 2 ,I , I I, ) ,
b)u=(-2,0,2,4);
~ ~ ~ ~ ( l . IO) , , ~l , ,= ( - 2 . - 1 . 0 . - I )
v , - ( l , l . 3 , 0 ) , v,=(-2,
- I , -2,1), V , - ( - 3 .
" I , 1,3)
6. Hallar la proyección ortogonal de u = (5, 6, 7 , 2) sobre el espacio solución de sistema
lineal homogéneo
7. Usando la fórmula (6) y el método del ejemplo 3, encontrar la matriz estándar de la
proyección ortogonal P:K2 -+ U
' sobrc
a) el eje x. b) el ejey.
[Nota Comparar los resultados con la tabla 4 de La sección 4.2.1
8. Por medio de la fórmula (6) y el método del ejemplo 3 , determinar la matriz estándar
de la proyección ortogonalP r R 3 -+R3 sobre
a)el plano x z .
b) el planoyz.
[Nofa Comparar los resultados con la tabla 5 de la secci6n 4.2.1
9. Sea We1 plano con ecuación 5x - 3y + I = O
a) Encontrar una base para W.
b) Con la fórmula (6); encontrar la matriz estándar para la proyección ortogonal sobrc
W.
c) Usar la matriz obtenida en el inciso b) para determinar la proyección ortogonal de
un punto Po(xo,y,,, z,,) sobre W.
d) Encontrar la distancia entre el punto P & l , -2, 4) y el piano W,y comprobar el
resultado mediante el teorema 3.5 -2
10. Sea Cz, la recta con ecuaciones paramktricas
a) Encontrar m a base para W.
b j Por medio de l a fórmula (6), encontrar la matriz estándar para la proyección ortogonal sobre W.
c) Usar la matriz obtenida en el inciso b) para encontrar la proyecci6n ortogonal de un
punto Po(xo,yo, zo) sobre W.
d) Hallar la distancia entre el punto Po(2, 1, - 3 ) y la recta W.
11. Para los sistemas linealesdel ejercicio 3, comprobar que ei vector de error AY - b que
resulta de la soluciónpor mínimos cuadrados F es ortogonal alespacio columna de A .
12. Demostrar: Si A tiene vectores columna linealmente independientes y si Ax = b es consistente, entonces la solución por mínimos cuadrados de Ax = b y la solución exacta de
Ax = b son iguales.
6.5 Matrices ortogonales; cambio de base
1
395
13. Demostrar: Si A tiene vectores columna linealmente independientes y si b es ortogonal
al espacio columnade A , entonces la solución por
mínimos cuadrados deAx = b es x = O.
+ W la proyección ortogonalde R" sobre un subespacio W.
a) Demostrar que [PI2= [PI .
b) ¿Qué indica el resultado del inciso a) con respecto a la composición P o P?
c) Demostrar que [PI es simétrica.
d) Comprobar que las matnces en las tablas 4 y 5 de la sección 4.2 tienen las propiedades indicadas en los incisos a) y c).
14. Sea PB"
15. Sea A una matriz m
X n con vectores renglol linealmente independientes. Encontrar
una matnz estándar para la proyección ortogonal de Rn sobre el espacio renglón de A .
[Sugerencia Empezar con la fórmula (6).]
6.5 MATRICES ORTOGONALES; CAMBIO DE BASE
Una base que es adecuada para un problema puede no ser para otro, de modo
que en elestudio de los espacios vectoriales unproceso común es cambiar de una
base a otra. Debido a que una base es la generalización a espacios vectoriales
de un sistema de coordenadas, el cambio de base es semejante a cambiar de
ejes de coordenadas en R2 y R3. En esta sección se estudiarán varios problemas
relacionados con el cambio de base. También se obtendrán propiedades de las
matricescuadradas que tienenvectores columna ortonormales. Estasmatrices
surgen en diversos contextos, incluyendo problemas en los que hay un cambio de
una base ortonormal a otra.
MATRICES
ORTOGONALES
Las matrices cuyas inversas se pueden obtener por transposiciones son tan importantes que existe una terminología asociada con ellas.
Definición. Una matriz cuadrada A con la propiedad
A-l'AT
se denomina matriz ortogonal.
Por la definición anterior se concluye que una matriz cuadradaA es ortogonal si y
sólo si
A A ~ = A ~ A = I
(1)
De hecho,por el teorema 1.6.3 se concluye que una matriz cuadrada A es
ortogonal si A A T = I, o bien, A TA = I.
396 / Espacios con producto interior
Ejemplo 1 La matriz
"1
"
7
1 0 0
=[O
0
1
0~ A
0
1
Ejemplo 2 Recordar que en la tabla 6 de la sección 4.2, la matriz estándar para la
rotación de R2 en sentido contrario a las manecillas del reloj por un ángulo 8, es
A = [
O
sen0
COS
1
-sen0
cos 0
Esta matriz es ortogonal para todas las elecciones de 8 ,ya que
De hecho, es fácil comprobar que todas las "matrices de reflexión" en lastablas 2 y
3 y todas las "matrices de rotación" en las tablas 6 y 7 de la sección 4.2 son
matrices ortogonales. A
Obsérvese que para las matrices ortogonales en los ejemplos 1 y 2, tanto los
vectores renglón como los vectores columna forman conjuntos ortonormales con
respecto al producto interior euclidlano (comprobar). Este hecho no es fortuito; es
una consecuencia del siguiente teorema.
Teorema 6.5.1. Las siguientes proposiciones son equivalentes para una matriz
A n x n.
a ) A es ortogonal.
b ) Los vectores renglón de A forman un conjunto ortonormal en R" con el producto interior euclidiano.
c ) Los vectores columna de A forman un conjunto ortonormal en R" con el
producto interior euclidiano.
Demostración. Se probará la equivalencia de a ) y b), y la equivalencia de a ) y c )
se deja como ejercicio para el lector.
a e b: El elemento en el i-ésinlo renglón y la j-ésima columna del producto
matricial A A T es el producto punto del i-ésimo vector renglón de A y el j -
6.5 Matrices ortogonales; cambio de base
i
397
Por tanto, A A =~I si y sólo si
r l - r l = r 2 . r 2 = .. .= rn-rn= 1
Y
ri-rj=O CuandoiZj
que son verdaderas si y sólo si rl, r2, . . . , rn es un conjunto ortonormal en R".
0
OBSERVACI~N. En vista del teorema 6.5.1 parece más apropiado denominar
matrices ortonormales a las matrices ortogonales. Sin embargo, no se hará así por
respeto a la tradición histórica.
ALGUNAS
PROPIEDADES
BASICAS DE
LAS MATRICES
ORTOGONALES
En el siguiente teorema se enumeran algunas propiedades básicas adicionales
de las matrices ortogonales. Las demostraciones son directas
y se dejan para
el lector.
Teorema 6.5.2.
a) La inversa de una matriz ortogonal es ortogonal.
b) Un producto de matrices ortogonales es ortogonal.
c) S i A es ortogonal, entonces det(A) = 1 o det(A) = - 1.
Ejemplo 3 La matriz
es ortogonal, ya que sus vectores renglón (y columna) forman conjuntos
ortonormales en R2. Se deja para el lector verificar que det(A) = 1. Intercambiando
los renglones se obtiene una matriz ortogonal para la cual det(A) = - 1. A
MATRICES
ORTOGONALES
COMO OPERADORES LINEALES
En el ejemplo 2 se vio que las matrices estándar para los operadores reflexión y
rotación básicos sobre R2 y R3 son ortogonales. El siguiente teorema ayudará a
explicar este hecho
398
i
Espacios con producto interior
Teorema 6.5.3. S; A es una matriz n
son equivalentes.
X
n, entonces las SigUienteS proposiciones
a ) A es ortogonal.
h ) &4xll = llxll para todo x en R".
c)Ax.Ay=x.yparatodoxyyenR".
Demostración.
Se probará la serie de implicaciones a * b * c
a 3 b : Supóngase que A es ortogonal, demodo que ATA
fórmula (8) de la sección 4.1,
b
3 c:
Supóngase que A x
=x
= I.
* a.
Entonces por la
para todo x en H". Por el teorema 4.1.6 se tiene
c 3 a: Supóngase que A x * Ay = x
fórmula (8) de la sección 4.1 se tiene
*
y para todo x y y en R". Entonces por la
que se puede volvera escribir como
x.(A~AY-~)=o
X . ( A ~ A- q Y = o
O
Como la expresión anterior es verdadera para todo x en R", en particular se
cumple si
x
= (A 7A
-
1)y
de modo que
-
( A ' A- I)y (A 'A
-
/)Y
=O
a partir de lo cual se puede concluir que
(¿por qué?). Así, (2) es un sistema homogéneode ecuaciones lineales que se
cumple para todo y en R". Pero esto significa que la matriz coeficientes debe ser
cero (¿por qué?), de modo que ATA = I y, en consecuencia,A es ortogonal. 0
Si T:R" 4 R" es la multiplicación por una matriz ortogonal A, entonces T se
denomina operador ortogonal sobre R". Por los incisos a ) y 6) del teorema
precedente se concluye que los operadores ortogonales sobre R" son precisamente
6.5 Matrices ortogonales; cambio de base / 399
los operadores que no modifican las longitudes de todos los vectores. Como las
reflexiones y las rotaciones de R2 y R3 tienen esta propiedad, este hecho explica la
observación en el ejemplo 2 de que las matrices estándar para las reflexiones y rotaciones básicas de R2 y R3 son ortogonales.
MATRICES DE
COORDENADAS
Recordar por el teorema 5.4.1 que si S = {vl, v,, . . . , vn} es una base para un espacio vectorial V, entonces todo vector v en V se puede expresar de manera única
como una combinación lineal de los vectores básicos, porejemplo,
v
= k,v,
+ k2v2+ . . . + k,V,
Los escalares k,, k,, . . . , kn son las coordenadas de v con respecto a S, y el vector
(v)s = (k,,
k2,
' ' '
>
k,)
es el vector de coordenadas de v con respecto aS. En esta sección será conveniente
enumerar las coordenadas como elementos de una matriz n x l . Así, la matriz
se define como la matriz de coordenadasde v con respecto aS.
CAMBIO DE
BASE
En las aplicaciones es común trabajar conmásdeun
sistema de coordenadas, y
suele ser necesario conocer la relación entre las coordenadas de
un punto o vector
fijo y los diversos sistemas de coordenadas. Como el concepto de base es la generalización de un sistema de coordenadas a espacios vectoriales, se llega a considerar el siguiente problema.
Problema del cambio de base. Si la base de un espacio vectorial se cambia de
cierta base inicial B a una base nueva B', j d m o está relacionada la matriz de coordenadas inicial [vlB de un vector v con la nueva matriz de coordenadas [ v ] ~ , ?
1
Por sencillez, este problema se resolverá para espacios bidimensionales. La
solución para espacios n dimensionales es semejante y se deja al lector. Sean
B
= {U,, U*}
y
B'
=
{u;, u;}
las bases inicial y nueva, respectivamente. Serán necesarias las matrices de coordenadas para los nuevos vectores básicos con respecto a la base inicial. Supóngase
que las matrices son
400
/
Espacios con producto interior
Es decir,
+ bu,
= cul + dU2
u; = "U1
u;
Ahora, sea v cualquier vector en V y sea
la nueva matriz de coordenadas, de modo que
Para determinar las coordenadas iniciales de v es necesario expresar v en términos
de la base inicial B. Esto se logra al sustituir (4) en ( 6 ) . Así se obtiene
v
= k,(au,
+ bu, j + k,(CU, + d U 2 )
O
v
= (k,"
+ k,c)u, + (k,b + k,d)U2
Entonces, la matriz de coordenadas inicial para v es
['IB
=
i"'" + k2c1
k,b + k,d
que se puede escribir como
o bien, por ( 9 ,
Esta ecuación establece que la matriz de coordenadas inicial [VI, se obtiene al
multiplicar la nueva matriz de coordenadas [vIBt por la izquierda por la matriz
Las columnas de esta matriz son las coordenadas de los nuevos vectores básicos
con respecto a la base inicial [véase (3)]. Así, se tiene la siguiente solución para el
problema del cambio de base.
6.5 Matrices ortogonales; cambio de base / 401
Sulución delproblema del cambio de base. Si se cambia la base para un
espacio vectorial, V de una base inicial B = {u1, u2, . . . , U,,}a una base nueva
B' = {u;& ,...,un] entonces la matriz de coordenadas inicial [VI, de un vector
[VI está relacionada con la nueva matriz de coordenadas [ V ] ~ 'del mismo vector
v por medio de laecuación
[VIB
= P[VI/?'
(7)
donde las columnas de P son las matrices de coordenadas de los nuevos
vectores básicos con respecto a la base inicial; es decir, los vectores columna de
P son
]E,[uilE,
MATRICES DE
TRANSICI~N
' ' '
>
[uAIB
La matriz P se denomina matriz de transición de B' a B y se puede expresar en
términos de sus vectores columna como
Ejemplo 4 Considerar las bases B = {u1, u2} y B' = {u;,ui} paraR2, donde
u1 = (1, O);
u2 = (O, 1);
U'(1, 1);
u' = (2, 1)
a) Encontrar la matriz de transición de B' a B
b) Por medio de (7), hallar [vIB si
Solución de a), Primero es necesario encontrar las matrices de coordenadas de
10s nuevos vectores básicos u1y u2 con respecto ala base inicial B. Por inspección,
I
,
+
u; = u, u2
u; = 2u, + u2
de modo que
Así, la matriz de transición de B' a B es
402 / Espacios con producto interior
Solución de b). Mdante (7) y la matriz de transición determinada eninciso
el a),
Como comprobación, debe ser posible recuperar el vector v a partir de [vIB o de
[ V ] ~ ' .Se al lector demostrar que - 3 u; + 5 u; = u; + 2 u; = v = (7, 2). A
Ejemplo 5 Considerar los vectores u1 = ( 1 , O ) , u2 = (O, I), u; = (1, l), u;,=
(2, 1). En el ejemplo 4 se encontró la matriz de transición de la base B' = { ul,
u; } para R2 a la base B = (u1 u*>. Sin embargo, también se podría pedir la
matriz de transición de B a B'. Para obtener esta matriz, simplemente se cambia el punto de vista y se considera a B' como la base inicial y a B como la base
nueva. Como de costumbre, las columnas de la matriz de transición son las coordenadas de los nuevos vectoresbásicos con respecto a la base inicial.
Igualando las componentes correspondientes y resolviendo el sistema lineal
resultante, el lector debe poderdemostrar que
~
u, = - u ;
+ u;
u2 = 2u;
-
u;
de modo que
Así, la matriz de transición de B a B' es
Si se multiplican entresí la matriz de transición deB' a B obtenida en el ejemplo
4 y la matrizde transición deB a B'obtenida en el ejemplo5, se encuentra
lo cual muestra que Q = Pfortuito.
l.
El siguiente teorema demuestra que este hecho no es
Teorema 6.5.4. Si P es la matriz de transición de una base B' a una base B,
entonces:
a ) P es invertible.
b ) P- es la matriz de transición de B a B'.
Demostración. Sea Q la matriz de transición de B a B'. Se probará que PQ
entonces se concluirá que Q = P" para completar la demostración.
=Iy
6.5 Matrices ortogonales; cambio de base / 403
Suponer que B = {ul, u2, . . . , U,} y que
..
Cl I
PQ =
..
C2 I
..
Por (7)
rx1B
-:I
Cnn
= p[xlB'
Y
[XIB, = Q[xIB
para todo x en V. Multiplicando la ecuación inferior por P por la izquierda y
sustituyendo la ecuación superior se obtiene
1 x 1 =~ ~ Q [ X ] B
(9)
para todo x en V. Con x = u1en (9) se obtiene
O
De manera semejante, la sustitución sucesiva de x = u2, . . . , u, en (9) da
. ,...
(. '
O
Por consiguiente, PQ =I.
En resumen, si P es la matriz de transición de una base B' a una base B,
entonces para todo vectorv se cumplen las siguientes relaciones:
... ..
."I
404
I
Espacios con producto interior
CAMBIO DE
BASE
ORTONORMAL
El siguiente teorema muestra que c.11 un espacio con producto interior, la matriz de
transición de una base ortonormal a otra es o; togonal.
Teorema 6-55. Si P es la maMz de lransición de una base ortonormal a otra
base ortorzormal para un espacioconproductointerior,
entonces I-' es una
matriz ortogonal; es decir,
Demostración. Suponer que Ves un espacio n dimensional con producto interior
y que P es la matriz de transición de una base ortonormal B' a una base ortonormal
R. Para demostrar que P es ortogonal se aplicará el teorema 6.5.36 y se probará
que llPxll = llxll para todo vector x en R".
Recordar por el teorema 6 . 3 . 2 ~que para cualquier base ortonormal de V, la
norma de cualquier vector u en Ves igual a la norma de su vector de coordenadas
en R" con respecto al producto interior euclidiano. Así. para cualquier vector u en
I se tiene
donde la primera norma es con respecto al producto interior sobre V y las normas
segunda y tercera son con respecto al producto interior euclidiano sobre R".
Ahora. sea x cualquier vector en R", y sea u el vector en V cuya matriz de
coordenadas con respecto a la base B' es x: es decir,
= x. Así, por (12),
liull =
ilPxll
IIXII =
con lo que se demuestra que P es ortogonal
ROTACIóN DE
EJES
COORDENADOS
0
Ejemplo 6 (Aplicación a la rotación de ejes de coordenados.) En muchos problemas se proporciona un sistema de coordenadas rectangulares x y , y al mover este
sistema en sentido contrario a las manecillas del reloj alrededor del origen por un
ángulo se obtiene un nuevo sistema de coordenadas rectangulares x". Cuando se
hace lo anterior, cada punto Q en el plano posee dos conjuntos de coordenadas: las
coordenadas (x, y ) con respecto al sistema xy y las coordenadas (xt,Y ' ) con respecto
al sistema x" (figura la).
AI introducir los vectores unitarios u, y u2 a lo largo de los ejes x y y
positivos y los vectores unitarios u l y u2 a l o largo de los ejes x' y y' positivos,
esta rotación se puede considerar como un cambio de una base inicial B = {u1,
u*} a una base nueva B' = { u;, u; } (figura l b ) . Así, las nuevas coordenadas
(x'. y ' ) y las coordenadas anteriores (x, y ) de un punto Q están relacionadas
por medio de
1
,
6.5 Matrices ortogonales; cambio de base / 405
[;:I
= p"[
;]
Y
Y
\
"
I
'
\
Figura 1
d)
[u;I R =
cos H
[sen
De manera semejante, por la figura Id, se observa que las componentes de u; en
la base inicial son cos (O + n12) = -sen O y sen (O + n12) = cos 8, de modo que
1
- sen
[4lS
=
cos
e
Así, la matriz de transici6rl de H ' a E cs
0
-sen 0
sen H
cos 8
COS
I
406 1 Espacios con producto interior
Observar que P es una matriz ortogonal, como seesperaba, ya que B' y B son bases
ortonormales. Así,
cos O sen 0
-sen O cos O
p-1 = p r =
1
de modo que (13) produce
o bien, de manera equivalente,
x' =
y' =
x cos O
"x
+ y sen 9
senO+ycos 8
Por ejemplo, si los ejes se hacen girar 8 = n14, entonces como
sen:
7T
4
% - 1
= cos - = -
4 v 5
la ecuación (14) se convierte en
[;:I
=
Por tanto, si las coordenadas iniciales de un punto Q son (x, y) = (2, - l), entonces
de modo que las nuevas coordenadas de Q son (x',y') = (11
A- 31a).A
O B S E R V A C I ~ N . Nótese que lamatrizde
coeficientes en (14) esigual a la
matriz estándar para el operador lineal que hace girar los vectores en R2 por
un ángulo -8 (tabla 6 de la sección 4.2). Este hecho era de esperarse, ya que
la rotación de los ejes de coordenadas por un ángulo 8 con los vectores de R2
fijos tiene el mismo efecto que hacen girar los vectores por un ángulo -8 con
los ejes fijos.
6.5 Matrices ortogonales; cambio de base / 407
Y
Figura 2
Ejemplo 7 (Aplicación a la rotación de los ejes de coordenadas en el espacio tridimensional.) Suponerque un sistemadecoordenadasrectangulares
xyz se hace girar alrededor de su eje z en sentido contrario a las manecillas
del reloj (mirando sobre el eje z positivo) por un ángulo 9 (figura 2). Si se introducen los vectores unitarios u , , u2 y u 3 a l o largo de los ejes x, y y z positivos, y los vectores unitarios ul, u2 y u3a lo largo de los ejes x!, y' y z' positivos, la rotación se puede considerar como el cambio de la base anterior B =
{ul, u2: u3} a la base nueva B' = { u;, u;, u; >. En vista del ejemplo 6 debe
ser obvro que
D
1
Además, como u\ se alarga 1 unidad sobre el ejez' positivo,
LU;lB =
[!]
Por tanto, la matriz de transición de B' a B es
cos 6
P = [sei0
y]
-sen8 O
co; 8
y la matriz de transición de B a B' es
cos 8 sen 8 O
(comprobar). Así, las nuevas coordenadas
y', z') de un punto Q sepueden
calcular a partir de sus coordenadas anteriores (x,y , z ) por medio de
(XI,
408
1;
Lspacios con producto interior
cos 0 sen H O
-sen8 cos 8 O
O
o
1
EJERCICIOS DE LA SECCIóN 6.5
1. Demostrar que
1 2 "
25
5
16
25
es una matriz ortogonal,
a) calculando ATA.
b) usando el inciso b ) del teorema 6.5. l .
c) usando el inciso c ) del teorema 6.5.1.
2. Encontrar la inversa dela matriz del ejercicio l .
3. Determinar cuáles de las siguientes matnces son ortogonales. Para las que sí sean, encontrar la inversa
O
O
1/%6
4. Comprobar que las matrices de rotación y las matrlces de reflexión en las tablas 2 y 3
de l a sección 4.2 son ortogonaies.
5. IIallar la matriz de coordenadas de w con respecto a la base S = {u,.u2} para R2.
a) u I = (1, O), u2 = (O, I ) ; w = (3, - 7 )
b) u , = (2, -4), u2 = (3, 8); w = (1, 1)
c) 11, = (1, l), u: == (O, 2); w = (a, 6)
6. Encontrar la matriz de coordenadas de v con respecto a la base S = {v,, v2, v3}
a) v = (2, - I . 3 ) ; v i = (I,O
. O), v2 = ( 2 , 2. O), v3 = ( 3 , 3 , 3)
b) v (5, - 12, 3); V , == ( 1 , 2, 3), v 2 z.( "4. 5. 6), ~3 = (7, - S , 9)
7. determinar la matnz decoordenadas de p con respecto a S = { p i , p,, p,}
a) p = 4 - 3x + x L ; p I = I , p2 = X , p3= x2
b)p=2--x+x2; p l = l + x , p2=I+x2, p3=~x+x2
8. Encontrar la matriz de coordenadas para A con respecto a S = {A,, A,, A,,A 4 j
O
112 O
6.5 Matrices ortogonales; cambio de base
9. Considerar las matrices de coordenadas
a) Hallar w si S es la base del ejercicio 6(a).
b) Encontrar q si S es labase del ejercicio 7(a)
c) Determinar B si S es la base del ejercicio 8.
10. Considerar las bases B = {U,, u2} y B' = {vl, v2} para R2, donde
a) Hallar la matriz de transición de B' a B.
b) Encontrar la matriz de transición de B a B'.
c) Determinar la matriz de coordenadas [w],, donde
y usando (1 I), calcular W ~ I .
d) Comprobar las respuestas mediante el cálculo directo de [w],~
11. Repetir las instrucciones del ejercicio 10 con
; I, +I,
12. Considerar las bases B = {u,,u2, u3} y B' = {vI,v2, v3) para R3, donde
ul=[;a].
u2=[
.+], .;=[
a) Encontrar la matriz de transición de B' a B.
b) Determinar la matnz de coordenadas [w],, donde
w=[;!]
y usando (1 1), calcular [wlBt.
c) Comprobar las respuestas mediante el cálculo directo de [w],,.
13. Repetir las instrucciones del ejercicio 12 con el mismo vector w, pero con
3 "1
vj=
l
/'
409
410
/
Espaclos con producto interior
a> Hallar la matriz de transición de B' a B.
b) Encontrar la matriz de transición de B a B'.
c) Calcular la matriz de coordenadas [pIR,donde p = -4
+ x, y usando 1l), calcular
b1,"
d) Comprobar las respuestas calculando directamente [p],~.
15. Sea Vel espacio generado por f, = sen x y f, = cos x.
a) Demostrar que g, = 2 sen x + cos x y g, = 3 cos x forman una base par V.
b) Determinar la matriz de transición de B' = {g,,g2) a B = {fl, f,} .
c) Encontrar la matnz de transición de B a B .
d) Calcular la matnz de coordenadas [h], , donde h = 2 sen x
(1 l), calcular [h],~.
e) Comprobar las respuestas calculando directamente [h],~
-
5 cos x, y usando
16. Sea un sistema de coordenadas rectangulares x)' obtenido al girar un sistema de coordenadas rectangulares xy en sentido contrario a las manecillas del reloj por un ángulo 0
= 3~14.
a) Determinar las coordenadasx y del punto cuyas coordenadasxy son (-2,6).
b) Encontrar las coordenadas xy del punto cuyas coordenadasx'y' son (5,2).
17. Repetir el ejercicio 16 con O = x13
18. Sea un sistema de coordenadas rectangulares xyz' obtenido al girar un sistema de
coordenadas rectangulares xyz en sentido contrario a las manecillas del reloj alrededor
del eje z (mirando sobre el eje z) por un ángulo 6 = d 4 .
a) Encontrar las coordenadas x'y!z' del punto cuyas coordenadasxyz son (- 1,2,5).
b) Determinar las coordenadas xyz del punto cuyas coordenadasxyz' son (1,6,
- 3).
19. Repetir el ejercicio 18 para una rotación de 0 = z13 en sentido contrario a las maneci-
llas del reloj alrededor del ejey (mirando a lo largo del eje y positivo hacia el origen).
20. Repetir el ejercicio 18 para una rotación de B = 3 ~ 1 4en sentido contrario a las manecillas del reloj alrededor del eje x (mirando a lo largo del eje x positivo hacia el
origen).
21. a) Un sistema de coordenadas rectangulares x'y'z' se obtiene al girar un sistema de
coordenadas xyz en sentido contrario a las manecillas del reloj alrededor del eje y
por un ángulo O (mirando a lo largo del eje y positivo hacia el origen). Encontrar
una matriz A tal que
donde (x, y , z) y ( 2 , y', z') son las coordenadas del mismo punto en los sistemas xyz
y x'y'z', respectivamente.
b) Repetir el inciso a) para una rotación alrededor del eje x.
6.5 Matrices ortogonales; cambio de base I' 41 1
22. Un sistema de coordenadas rectangularesx'lyIIz'' se obtiene al girar primero un sistema
de coordenadas xyz en sentido contrario a las manecillas del reloj alrededor del eje z
por un ángulo'de60° (mirando a lo largo del
eje z positivo hacia el origen) para obtener un
sistema de, coordenadas xyz', y luego al girar el sistema de coordenadasxyz' en sentido
contrario alas manecillas del reloj alrededor del eje y por un ángulo de 4 5 O (mirando a
lo largo del eje y positivo hacia el origen). Encontrar una matriz
A tal que
donde (x, y , z) y (x", y " , z") son las coordenadas q z y x"y"z" y del mismo punto,
respectivamente.
23. ¿Qué condiciones deben cumplira y b para que la matriz
[ zz ]
sea ortogonal?
24. Demostrar que una matriz ortogonalA tiene una de las dos formas posibles:
cos 0
A = [sen 0
-
sen0
cos 0
1
o
A=
[
cos 0
-sen 0
-senO]
- cos 0
donde O S 8 < h.
[Sugerencia. Empezar con una matriz general A = (a..) 2 X 2, y
I)
aplicar el hecho de que los vectores columna formanun conjunto ortogonal enR'.]
25. a) Aplicar el resultado del ejercicio 24 para demostrar que la multiplicación por una
matriz ortogonal2 X 2 es una rotación o una rotación seguida de una reflexiónalrededor del eje x.
b) Demostrar que la multiplicación por A es una rotación si det(A) = 1 y una rotación
seguida de unareflexión si det(A) = - l.
26. Usar el resultado del ejercicio 25 para determinar si la multiplicación por A es una
rotación o una rotación seguida de una reflexión. En cada caso, encontrar el ángulo
de rotación.
27. El resultado del ejercicio 25 tiene unanálogoparamatricesortogonales
3 X 3: se
puede demostrar que la multiplicación por una matriz ortogonal A 3 X 3 es una rotación alrededor de algún eje fijo si deyA) = 1 y que es una rotación alrededor de algún
eje fijo seguidade una reflexión con respecto a algún planode coordenadas si det(A) =
- l . Determinar si la multiplicación porA es una rotación o es una rotación seguida de
una reflexión.
3
2
412 iEspacios con producto interior
28. Con el resultado del ejercicio 27 y el inciso b ) del teorema 6.5.2, demostrar que una
composición de rotaciones siempre se puede efectuar mediante una simple rotación con
respecto a algún eje idbneo.
29. Demostrar la equivalencia de las proposiciones u)y c) del teorema 6.5.1
1
1 EJERCICIOS COMPLEMENTARIOS
1. Sea conelproducto interior euclidiano.
a) Obtener un vector d que sea ortogonal a u1= ( I , O, O, O) y a u4 = (O, O,O, 1) y
forme ángulos iguales COR u2 = (O, 1, O, O) y u3 = (O, O, 1 O).
b) Encontrar un vector x = (x,, x*, x3, x4) de longitud 1 que sea ortogonal a los vectores
u1 y u4 del inciso a) y tal que el coseno del ángulo entre x y u2 sea el doble del
coseno del ángulo entre x y u3.
2. llemostrar que si x es un vector diferente de cero en Rn, entonces la matriz n
X
n
es ortogu:;al y simétrica.
3. Sea A x = O un sistema de m ecuaciones con n inc,ógnitas.Demostrar que
es una soluci6n del sistema si y sólo si el vector x = (x,, xz, . . . , x,) es ortogonal a
lodo vector renglón de A con el producto interior euclidiano sobre R".
4. Aplicar la desigualdad de Cauchy-Schwarz para demostrar que si a l , u2, . . . , a , son
números reales positivos, entonces
5. Demostrar que si x y y son vectores en un espacio con producto interior y c es
cualquier escalar, entonces
i/cx + y y
= (.2I/xjlZ
+ 2c( x, y ) + I/y/l2
6. Sea R3 con el producto interior euclidiano. Encontrar dos vectores de longitud 1 que
sean ortogonales a todos y cada uno de los vectores u , = (1, 1, - I ), u2 = (-2, - 1,2) y
u3 = ( - 1 , o, X).
Ejercicios complemenfarios i 413
7. Encontrar un producto interior euclidiano ponderado sobreRn tal que los vectores
v , = ( l , O , O , . . . O)
)
v , = ( O , ~ , O, . . . , O )
vi = (O, O, v?, . . . , O)
v,
=
(O, O,
o,
. . .,
d i)
formen un conjunto ortonormal.
8. ¿Existe algún producto interior euclidiano ponderado sobre R2 para el que los vectores
(1,2) y (3,
- 1) formen un conjunto ortonormal? Justificar la respuesta.
9. Demostrar: Si Q es una matriz ortogonal, entonces cada elemento de Q es igual a su
cofactor si det(Q)= 1 y es el negativo de su cofactor si det(Q) = - l .
10. SI u y v son vectores en un espacio V con producto interior, entonces u, v y u - v se
pueden considerar como los lados de un "triángulo" en V (figura 1). Demostrar que la
ley de los cosenos se cumple para cualquiera de estos triángulos; es decir, IJu- vil2 =
llul12+ llv112 - 2llull llvll cos 8, donde 0 es el ángulo entre u v v.
11. a) En R3, los vectores (k, O, O), (O, k, O) y (O, O, k) forman las aristas de un cubo con
diagonal ( k , k, k ) (figura 4 de la sección 3.3). De manera semejante, en Rn,los
vectores
se pueden considerar como las aristas de un "cubo" con diagonal (k, k, . . . , k). Demostrar que cada una de las aristas anteriores forma un ángulo igual a Q con la diagonal, donde cos 0 = l 1 6 .
b) (Para quienes ya estudiaron Crilculo.)¿Qué sucede con el ángulo Q en el inciso a)
cuando la dimensión de Rn tiende a infinito?
12. Sean u y v vectores en un espacio con producto interior.
a) Demostrar que llull = Ilvll si y sólo si u + v y u - v son ortogonales.
b) Proporcionar una interpretación geométnca del resultado anterior en R2 con el producto interior euclidiano.
13. Sea u un vector en un espacio V con producto interior, y sea {v,, v2, . . . , vn) una base
ortonormal para V. Demostrar que siaies el ángulo entre u + vi, entonces
cos2 a , + cos2 ff2
+
' ' '
+ cos2 a, = 1
14. Demostrar: Si (u, v ) ~
y (u, v)* son dos productos interiores sobre un espacio vettorial V, entonces la cantidad (u, v) = (u, Y), + (u,
también es un producto in-
terior.
41 4
Espacios con producto interior
15. Demostrar que el producto interior sobre Rn generado por cualquier matriz ortogonal es
el producto interior euclidiano.
16. h c o n t r a r a, b y c tales que la matriz
sea ortogonal. ¿Son únicos los valores de a, b y c ? Explicar la respuesta
17. Demostrar el inciso c) del teorema 6.2.5.
7
CAPITULO
EIGENVALORES,
EIGENVECTORES
7.1
EIGENVALORES Y EIGENVECTORES
Si A es una matrizn X n y x es un vector enR", entonces no hay ninguna relación
geométrica general entre el vector x y el vector Ax vgura la). Sin embargo, a
menudo existen ciertos vectores x diferentes de cero tales que x y Ax son múltiples escalares entre si yigura lb). Estos vectores surgen de manera natural en
el estudio de vibraciones, sistemas eléctricos, genética, reacciones químicas, mecánica cuántica, esfuerzo mecánico, economía y geometria. En esta sección se
mostrará cómo encontrarestos vectoresy , en seccionesposteriores, se abordarán
algunas de sus aplicaciones.
AX
AX
Figura 1
REPASO DE
EIGENVECTORES Y
EIGENVALORES
Se empezará con un repaso de algunos conceptos mencionados en las secciones
2.3. y 4.3.
R" se denomina eigenvector de A si Ax es un múltiplo escalar de x; es decir,
Ax= Ax
para algún escalar A. El escalar A se denomina eigenvalor de A, y se dice que x
es un eigenvector de A correspondiente a A.
415
4I 6
"
Eigenvalores, eigenvectores
En R2 y H 3 , la multiplicación por A mapea cada eigenvector x de A (en caso
de haber alguno) sobre la misma recta que pasa por el origen que x. Dependiendo
del signo y la magnitud del eigenvalor A correspondiente a x, el operador lineal A x
= Ax hace que x se comprima o alargue por un factor A, con un cambio de dirección en caso de que sea R negativo (figura 2).
Ejemplo 1 El vector x =
[:I
es un eigenvector de
correspondiente al eigenvalor ,
I= 3 , ya que
Para encontrar los eigenvalores de una matriz A n
bir como
Ax
=
X n , A x = Ax
se vuelve a escri-
dlx
o bien, de manera equivalente.
Para que A sea un eigenvalor, debe existir una solución diferente de cero
para esta ecuación. Sin embargo, por el teorema 6.2.7, la ecuación (1) tiene una
solución Merente de cero si y sólo si
Esta expresión se denomina ecuaciún caracteristica de A ; los escalares que satisfacen esta ecuación son los eigenvalores de A . Al desarrollar det(A1 - A ) se obtiene un polinomio en A, denominadopolinomio característico deA .
7.I Eigenvalores y eigenvectores / 41 7
Se puede demostrar (ejercicio 15) que si A es una matriz n X n, entonces el polinomio característico de A es de grado n y el coeficiente de 1" es 1; es
decir, el polinomio característico de una matriz n x n es de laforma
Por el teorema fundamental del álgebra, la ecuación característica
tiene cuando mucho n soluciones &stintas, por lo que una matriz n X n tiene a lo
sumo n eigenvalores distintos.
Sería conveniente que el lector revise el ejemplo 6 de la sección 2.3, donde
se encontraron los eigenvalores de una matriz 2 X 2 resolviendo la ecuación
característica. En el siguiente ejemplo se usa una matriz 3 X 3 .
Ejemplo 2 Encontrar los eigenvalores de
Solución. El polinomio característico de A es
A
det(A1-A)
= det[
O
-4
-1
A
o
-
1
17 A - 8
]
= A3 - 8A2
+ 17A-
4
Por consigwente, los eigenvalores de A deben satisfacer la ecuación cúbica
Para resolverestaecuaciónseempezarábuscandosolucionesenteras.Esta
sotarea se puede simplificar bastante aprovechando el hecho de que todas las
luciones enteras (en caso de que haya) de una ecuación polinomial con coeficientes enteros
A* + C,A"
+ . . + c, = o
'
deben ser divisores del término constante, cn. Así, las únicas soluciones enteras
posibles de (2) son los divisores de -4, es decir, +1, 22, +_4. Sustituyendo
sucesivamente estos valores en (2) se observa que 1 = 4 es una solución entera. En
consecuencia, 1 - 4 debe ser un factor del miembro izquierdo de
(2). Dividiendo 1 -4 entre A3 -%I2 + 171 - 4 se observa que (2) se puede volver a escribir como
418
Bigenvalores. tigenvectores
(A-4)@-4A+
1)=0
Así. las otras soluciones de (2) satisfacen la ecuación de segundo grado que se
puede resolver aplicando la fórmula cuadrática. Así, los eigenvalores de A son
EIGENVALORES
DE MATFUCES
TRIANGULARES
Ejemplo 3 Encontrar los eigenvalores de la matriz triangular superior
A=[
0
u22
023
a24
Solucicin. Recordando que el determinante de una matriz triangular es el producto de los elementos de la diagonal principal (teorema 2.2.2), se obtiene
det(A1 -
=
( A - “ 1 1 ) ( A - “ 2 2 ) ( A - a j j ) ( A- U 4 . l )
Así, la ecuación característica es
(A--u,~)(~~-~~~~~(A~11~3)(A“a,~)=o
y los eigenvalores son
i, = u,,.
A = u:?,
A = 1133,
A = UJJ
que son precisamente los elementos de la diagonal de A . A
El siguiente teorema general debe ser evidente a partir de 10s cálculos
efectuados en el ejemploprecedente.
Teorema 7.1.1. Si A es una matriz triangular (triangular superior, triangular
inferior o diagonal) n X n, entonces los eigenvalores de A son los elementos
de la diagonal principal de A .
7.1 Eigenvalores y eigenvectores / 419
Ejemplo 4 Por inspección, los eigenvalores de la matriz triangular inferior
OBSERVACI~N. En problemas reales, la matriz A a menudo es tan grande que el
cálculo de la ecuación característica no es práctico. Como resultado, para obtener
eigenvalores se aplican varios métodos deaproximación.
EIGENVALORES
COMPLEJOS
Es posible que la ecuación caracteristica de una matriz con elementos reales tenga
soluciones complejas. Por ejemplo, el polinomio característico dela matriz
es
demodo que la ecuación característica es A2 + 1 = O, cuyas soluciones son los
números imaginarios 1 = i y 1 = -i. Así, es forzoso considerar eigenvalores
complejos, inclusive para matrices reales. Esto, a su vez, conduce a considerar la
posibilidad de espacios vectoriales complejos; es decir, espacios vectoriales en que
se permite que los escalares asuman valores complejos. Estos espacios vectoriales se
analizarán en el capítulo 10. Por ahora se permitirán eigenvalores complejos, pero
el análisis de eigenvectores se limitará a matrices con eigenvalores reales.
El siguiente teorema resume el análisis realizado hasta el momento.
Teorema 7.1.2. Si A es una matriz n X n y 1 es un número real, entonces las
siguientes proposiciones son equivalentes
a)
6)
c)
6)
DETJCRMINACIÓN DE BASES
PARA
EIGENESPACIOS
A es un eigenvalor de A :
El sistema de ecuaciones @I - A)x = O tiene soluciones no triviales
En R” existe un vector x diferente de cero tal que Ax = Ax.
A es una solución de la ecuación característica det(AI - A ) = O .
Ahora que ya se sabe cómo obtener los eigenvalores, se abordará el problema de
determinar eigenvectores. Los eigenvectores de A correspondientes a un
eigenvalor son los vectores x diferentes de cero que satisfacenA x = Ax. De manera
equivalente, los eigenvectores correspondientes a 1 son los vectores Werentes de
cero en el espacio solución de (AI - A)x = O . Este espacio solución se denomina
eigenespacio de A correspondiente a A.
420
Eigenvalores, eigenvectores
Ejemplo 5 Encontrar bases para los elgenespacios de
Solucion. LA ecuación característica de A es A3 - 5A2 + SA - 4 = O o bien, en
forma factorizada, (A - 1)(A - 2)2 = O (comprobar); así los eigenvalores de -4
son A = 1 y I, = 2, de modo que existen dos eigenespacios de A .
Por definición,
es un eigenvector de A correspondiente a A si y sólo si x es una solución no trivial
de (11 - A)x = O; es decir, de
Si A
= 2,
entonces ( 3 ) se convierte en
Resolviendo este sistema se obtiene (comprobar)
x, = "S,
x2 =
t,
x3 = S
Así, los eigenvectores de A corresponhentes a 1 = 2 son los vectores diferentes de
cero de laforma
x=[-;]=[-!]+[;];.[
-Y
1
Como
son linealmente independientes, estos vectores forman una base para el eigenespacio correspondiente a A = 2.
Si 1 = 1, entonces ( 3 ) se convierte en
7.1 Eigenvalores y eigenvectores / 421
Resolviendo este sistema se obtiene (comprobar)
[";I
de modo que
=.y[
-;
1
[-T]
es una base para el eigenespacio correspondiente a L
EIGENVALORES
DE LAS
POTENCIAS DE
UN MATRIZ
= l.
A
Una vez que se han determinado los eigenvalores y los eigenvectores deuna
matriz A , es fácil encontrar los eigenvalores y los eigenvectores de cualquier
potencia entera positiva de A ; por ejemplo, si 1 es un eigenvalor de .4 y x es un
eigenvector correspondiente, entonces
A2x = A ( A x ) = A(Ax) = A(Ax) = il(dx) = A2x
lo cual demuestra que L2 es un eigenvalor de A 2 y que x es un eigenvector correspondiente. En general, se tiene el siguiente resultado
Teorema 7.1.3. Si k es un entero positivo, 1 es un eigenvalor de una matriz A y
x es un eigenvector correspondiente, entonces Lk es un eigenvalor de A k y x es
un eigenvector correspondiente.
Ejemplo 6 En el ejemplo 5 se demostró que los eigenvalores de
son 1 = 2 y L 1, de modo que por el teorema 7.1.3 tanto L
l7 = 1 SOR eigenvalores deA7. TambiCn se demostró que
x
= 27 =:
128 como 1 =
122 1 Eigenvalores, eigenvectores
son eigenvectores de A correspondientes al eigenvalor A = 2, de modo que por el
teorema 7.1.3 también son eigenvectores de A7 correspondientes a 1 = 27 = 128,
De manera semejante, el eigenvector
de A correspondiente al eigenvalor A
pondiente a A = l7 = 1. A
EIGENVALORES
E
INVERTIBILIDAD
=
1 también es un eigenvector de A7 corres-
El siguiente teorema establece una relación entre los eigenvalores y la invertibilidad de una matriz.
Teorema 7.1.4. Una matriz cuadrada A es invertible sí y sólo si 1 = O no es un
eigenvalor de A .
Demostración. Supóngase que A es una matriz n
= O es una solución de laecuación característica
X
n y obsérvese primero que A
si y sólo si el término constante c, es cero. Así, basta demostrar que A es invertible si y sólo si cn f O. Pero
o bien, haciendo 1 = O,
det(-A)=c,,
o
(-l)”det(A)=c,
Por la última ecuación se concluye que det(A) = O si y sólo si c,
vez significa que A es invertible si y sólo si c, f O. 0
=
O, y esto a su
Ejemplo 7 La matriz A del ejemplo 5 es invertible, ya que tiene eigenvalores A = 1
y 1 = 2, ninguno de los cuales es cero. Se deja que el lector verifique esta
conclusión demostrando que det(A) Z O. A
7.1 Eigenvalores y eigenvectores / 423
El teorema 7.1.4 permite agregar otro resultado al teorema6.4.5.
RESUMEN
Teorema 7.1.5. Si A es una matriz n X n, y si TA:Un+ R" es la multiplicacrbn
por A , entonces las siguientespoposiciones son equivalentes.
a) A es Invertible.
b ) A x = O sólo tiene la solución trivial.
c ) La forma escalonada reducida de A es In,
d) A se puede escribir como un producto de matrices elementales.
e ) A x = b es consistente para toda matriz b n X 1.
fi A x = b tiene exactamente una solución para toda matriz b n X 1 .
g ) de@!) f O.
h ) El rango de TA es R".
i ) TA es uno a uno.
j> Los vectores columna de A son linealmente independientes.
k ) Los vectores renglón de A son linealmente independientes.
I) Los vectores columna de A generan a U".
m ) Los vectores renglón de A generan a R".
n ) Los vectores columna de A forman una base para R".
o ) Los vectores renglón de A forman una base para R".
p ) El rango de A es n.
q ) La nulidad de A es O.
r ) El complemento ortogonal del espacio nulo de A es R".
S)
El complemento ortogonal del espacio renglón de A es ( O 1.
t) A'A es invertible.
u ) A = O no es un eigenvalor de A .
Este teorema relaciona los temas más importantes estudiados hasta el momento
EJERCICIOS DE LA SECCIóN 7.1
1. Encontrar las ecuaciones caracteristicas de las siguientes matnces:
2. Encontrar los eigenvalores de las matrices del ejercicio 1
3. Encontrar bases para los eigenespacios de las matnces del ejercicio 1
4. Determinar las ecuaciones características de las siguientes matrices.
a)
L: 1 11
-2
1 O
424
Eigenvalores, eigenvectores
-4
-2
5. Obtener los eigenvalores de las matrices del ejercicio 4.
6. Hallar las bases de los eigenespacios de las matnces del ejercicio 4.
7. Encontrar las ecuaciones características de las siguientes matrices:
8. Determinar los eigenvalores de las matrices del ejercicio 7.
9. Encontrar las bases de los eigenespacios de las matrices del ejercicio 7
10. Por inspección, hallar los eigenvalores dea
lssiguientes matrices:
11. Encontrar los eigenvalores de A' para
O
3
7
0
0
11
O 0 0
12. Encontrar los eigenvalores y bases para los eigenespacios deA25 para
-1
A=[-;
-2
-2
-f I]
13. Sea A una matnz 2 X 2. La recta que pasa por el origen de R2 es inwuiante bajo A si
Ax está sobre la recta cuando x también lo está. Encontrar las ecuaciones de las rectas
en R2, en casode haberlas, que son invariantes bajo la m a w dada.
14. Encontrar det(A) dadoque A tiene ap@) como su polinomio característico
b) p ( a ) = a4 - l 3 7
a) p(a) = a3- 2a2 + l. + 5
+
[Sugerencia Véase la demostración del teorema7.1.4.1
15. Sea A una matriz n
X n.
a) Demostrar que el polinomio característico deA es de grado n.
b) Demostrar que el coeficiente de 1' en el polinomio Característico es 1.
7.1 Eigenvalores y eigenvectores / 425
16. Demostrar que la ecuación característica de una matriz A 2
como A2 - tr(A)1, + det(A) = O, donde tr(A)es la traza de A.
X
2 se puedeexpresar
17. Usando el resultado del ejercicio 16, demostrar que si
entonces las soluciones dela ecuación característica deA son
(u + d ) t v ( u - d)'
+ 4bc I
Usando el resultado anterior, demostrar queA
a) tiene dos eigenvalores reales distintos si (a - d)2 + 4bc > O
b) tiene un eigenvalor real si (a - d)2 + 4bc = O.
c) no tiene eigenvalores reales si (a - q2+ 4bc < O.
18. Sea A la matriz del ejercicio 17. Demostrar quesi (a - d)2 + 4bc > O y b f O, entonces
los eigenvectoresde A correspondientes a los eigenvalores
Al
+d)+v
=$[(u
( u - d ) 2 + 4bc
]
y
/I2
=
[ ( u+ d ) - d ( u - d)2+ 4bc
son
respectivamente.
19. Demostrar: Si a, b, c y d son enteros tales que a + b = c + d, entonces
tiene eigenvalores enteros, a saber, 1,= a + b y L2
ejercicio 17.1
=a
- c.
[Sugerencia Vease el
20. Demostrar: Si 1 es un eigenvalor de una matnz invertible A y x es un eigenvector co-
rrespondiente, entonces 111 es un eigenvalor de A"
diente.
y x es un eigenvector correspon-
21. Demostrar: Si 1 es un eigenvalor de A, x es un eigenvector correspondiente y S es un
escalar, entonces 1 - S es un eigenvalor de A - SZ y x es un eigenvector correspon-
diente.
22. Encontrar los eigenvalores y bases para los eigenespaciosde
Luego,usando10s ejercicios 20 y 21, encontrar los eigenvalores y basespara
eigenespacios de
c) A + 21.
a) A-'.
b) A - 31.
10s
326
,/
Eigenvalores, eigenvectores
23. a) Demostrar que si A es una matriz cuadrada, entonces A y AT tienen los mismos
eigenvalores. [Sugerencia Considerar la ecuación característica det(A.1 - A) = O.]
b) Demostrar que A y AT no necesariamente tienen los mismos elgenespacios. [Sugerencia IJsando el resultado del ejercicio 18, encontrar una matnz 2 X 2 para la
cual A y AT tengan eigenespaclos diferentes.I
7.2 DIAGONALIZACI~N
En esta sección se vera cómo encontrar un base para R" integrada por eigenvectores de una matpiz dada A n x n. Las bases se pueden usar para estudiar las
propiedades geométricas de A y para simplrficar varios cálculos numéricosdonde
aparece A . Estas bases también revisten importanciaJsica en una amplia gama
de aplicaciones, algunas de las cuales serán consideradas después en este texto.
EL PROBLEMA
DE LA
DIAGONALIZACIÓN DE
MATRICES
El objetivo principal de esta sección es mostrar que los dos problemas siguientes,
que a simplc vista parecen muy diferentes, en realidad son equivalentes.
Problema del eigenvector. Dada una matriz A n
R" integrada por eigcnvectores de A?
X
n, jexiste una base para
Problema de diagonalización (Forma matriciag. Dada una matriz A n
jexiste una matriz invertible P tal que P-IAP sea una matriz diagonal?
X
n,
El segundo problema sugiere la siguiente terminología.
Definición. Se dice que una matriz cuadrada A es diagonalizable si existe una
matriz invertible P tal que P"AP es una matriz diagonal; se &ce que la matriz
P diagonaliza a A ,
El siguiente teorema muestra que el problema del eigenvector y el problema
de diagonalización son equivalentes.
Teorema 7.2.1. Si .-I es una matriz n
s o n equivalentcs.
X
n. entonces las siguientes proposiciones
a ) A es diagona/izahle.
h ) '4 lime n eigenvectores linealrnente independientes.
Demostración de a +-6): Como se supone que A es diagonalizable, entonces existe
una matriz invertible
7.2 Diagonalización / 427
P=
PI1
PI2
'..
P21
P22
...
Pnl
Pn2
' ' '
tal que P-lAP es diagonal, por ejemplo,P- 'AP = D, donde
D=
Por la fórmula P-'AP
=D
se deduce que A P = PD; es decir,
Si ahora p,, p,, . . . , p, denotan los vectores columna de P, entonces por ( I ) las
columnas sucesivas de A P son Alpl, A,p,, . . . ,Anp,. Sin embargo, por la fórmula
( 3 ) de la sección 1.3, las columnas sucesivas de A P son Ap,, Ap,, . . . , Ap,. Así,
se debe tener
AP,
= alp,,
A P , = il2p-2, . .
3
AP,
Anpn
(2 1
7
Como P es invertible, no todos sus vectores columna son cero; así, por (2) se
concluye que A,, A,, . . . , A, son eigenvalores de A, y que p l , p,, . . . , p, son los
eigenvectores correspondientes. Como P es invertible, por el teorema 7.1.5 se
concluye que p l , p,, . . . , p, son linealmente independientes. Por tanto, A tiene n
eigenvectores linealmente independientes.
b * a: Supóngase que A tiene n eigenvectores linealmente independientes, p,, p2,
. .. . , p,, con los eigenvalores correspondientesA,, A,, . . . , A,, y sea
PI1
PI2
P2l
P22
P ~ IP n 2
'.'
.
' '
' "
Pnn
la matriz cuyos vectores columna son p,, p,, . . . , p,. Por la fórmula ( 3 ) de la
sección 1.3, los vectores columna del producto A P son
428
Eigenvalores, eigenvectores
Pero
de modo que
AP
=
donde D es la matriz diagonal que tiene los eigenvalores A,, A 2 , . . . , A, sobre
la diagonal principal. Como los vectores columna de P son linealmente independientes, P es invertible; así, (3) se puede volver a escribir como P-lAP = D; es
decir, A es diagonalizable.
u
PRQCEDIMIENTO PARA
DIAGONALEAR
UNA MATRIZ
El teorema precedente garantiza que una matriz A n X n con n eigenvectores
linealmente independientes es diagonalizable, y la demostración proporciona el
siguiente método para diagonalizar a A .
I Paso 1.
Paso 2.
Paso 3.
Encontrar n eigenvectores linealmente independientes de A, por
ejemplo, pl, P,, . .. . , P,.
Formar la matriz P con pl, p2, . _.. , p, como sus vectores columna.
Entonces, la matriz P"A P será diagonal con Al, A,, . . . , A, como
sus elementos diagonales sucesivos, donde A, es el eigenvalor correspondiente a p, para i = 1, 2, . . . ,n.
Para efectuar elpaso
1 de este procedmiento, primero es necesario
determinar si una matriz dada A n x n tiene n eigenvectores linealmente indepenlentes, y luego se requiere un método para encontrarlos. Ambos problemas se
pueden manejar a la vez determinando las bases de los eigenespacios de A . Después, en esta sección se mostrará que los vectores básicos, como conjunto combinado, son linealmente independientes, de modo que si en total hay n vectores así,
entonces A es diagonalizable y los n vectores básicos se pueden usar como los vectores columna de la matriz de diagonalización P. Si hay menos de n vectores bhsicos, entonces la matriz A no es diagonalizable.
7 . 2 Diagonalización / 429
Ejemplo 1 Encontrar una matriz P que diagonalice a
Solución. En el ejemplo 5 de la sección precedente, se encontró que la ecuación
característica de A es
(A - l)(A - 2)* = o
=[-;I,
y se determinaron las siguientes bases para los eigenespacios:
L=2:
p,
p2=[;]
En total hay tres vectores básicos, de modo que la matriz A es diagonalizable y
diagonaliza a A . Como comprobación, el lector debe
verificar que
1
p-lAp=[-:
o
- ~ ] [;~ :I[ ;
2
0
0 - 2
-1
0 - 2
:I=[:: ;
2 0 0
;]A
No existe ningún orden de preferencia para el orden de las columnas de P.
Como el i-ésimo elemento de la diagonal de P-lAP es un eigenvalor para el iésimo vector columna de P, al cambiar el orden de las columnas de P simplemente
se cambia el orden de los eigenvalores sobre la diagonal de P-lAP. Entonces, si
en el ejemplo 1 se hubiera escrito
-1
P=[
En el ejemplo 1 se hubiera obtenido
-2
o
; ;]
430
Eigenvalores,
eigenvectores
o o
2
Ejemplo 2 Encontrar una matriz P que diagonalice a
Solución.
El polinomio característico de A es
A-1
det(A.l-~A)= - 1
3
o
O
A-2
-5
O
1-2
= ( A - l)(A-2)2
de modo que la ecuación característica es
( A - 1 ) ( A 2)* = o
-
Así, los eigenvalores de A son il = 1 y 1 = 2. Se deja para el lector demostrar que
bases para los eigenespacios son
Como A es una matriz 3
no es diagonalizable.
X
3 y en total sólo hay dos vectores básicos, entonces A
Otra solución. Si sólo se quiere determinar si una matriz es diagonalizable y no
importa determinar realmente una matriz de diagonalización P, entonces no es
necesario calcular las bases de los eigenespacios; basta encontrar las dimensiones
de los eigenespacios. Para este ejemplo, el
eigenespacio correspondiente a A = 1 es el
espacio solución del sistema
La matriz de coeficientes tiene rango 2 (comprobar). Así, la nulidad de esta matriz
es 1 y, por el teorema 5.6.4, el espacio solución es unidimensional.
El eigenespacio correspondente a il= 2 es el espacio solución del sistema
7.2 Diagonalización / 431
Esta matriz de coeficientes también tiene rango 2 y nulidad 1 (comprobar), de
modo que el eigenespacio correspondiente a A = 2 también es unidimensional.
Como los eigenespacios producen un total de dos vectores básicos, la matriz A no
es diagonalizable. A
En el ejemplo 1 se establece la hipótesis de que los vectores columna de P,
que están integrados por vectores básicos de los distintos eigenespacios de A , son
linealmente independientes. En el siguiente teorema se aborda esta cuestión.
Teorema 7.2.2. Si v l , v,, . . , vk son eigenvectores de
eigenvalores distintos A,, A,, . . ,A,, entonces { v ~v,,
, .
linealmente independiente.
A correspondientes a
,
,
, ,
, vk}es un conjunto
Demostración. Sean vl, v,, . . . , vk los eigenvectores de A correspondientes a
eigenvalores distintos A,, A,, . . . , A,. Se supondrá que v19v,, . . . , vk son
linealmente dependientes y se llegará a una contradicción. Entonces la conclusión
será que v l ,v,, . . . ,vk son linealmente independientes.
Como por definición un eigenvector es diferente de cero, {vl }es linealmente
independiente. Sea r el mayor entero tal que { v , , v,, . . . , vr} sea linealmente independiente. Como se está suponiendo que {vl, v,, . . . , vk} es linealmente dependiente, r satisface 1 5 r < k. Además, por la definición de r, { v l ,v,, . . . , vr+,}
es linealmente dependiente. Así, existen escalares c,, c, . . . , c,.+~, notodos
iguales a cero, tales que
CIVl
+ c2v* +
' ' '
+ e,.+ ]V,..+
I
=
o
(4)
Multiplicando por A ambos miembros de(4) y usando
se obtiene
ClA1V,
+ c2A,v, +
' ' '
+ cy+lAr+]V,+
Multiplicando por Ar+, ambosmiembrosde
resultante, se obtiene
1
=
o
(5)
(4) y restando de (5) la ecuación
Como { v l ,v,, . . . , vr} es un conjunto linealmente independiente, esta ecuación
indica que
132
Eigenvalores, eigenvectores
y como Al, A2, . . . ,
son distintos, seconcluye que
c,="z="'=cr=()
Sustituyendo estos valores en (4) se obtiene
Como el eigenvector v,.+~es diferente de cero, se concluyeque
Las ecuaciones (6) y (7) contradicen el hecho de que no todos los c l , c 2., . . , c,+,,
son cero; esto completa la demostración. 0
OBSERVACI~N. El teorema 7.2.2 es un caso especialde
un resultado más
son eigenvalores distintos y que en cada
general: Supóngase que A,, ,I2, . . .
uno de los eigenespacios correspondientes se elige un conjunto linealmente
independiente. Si después estos vectores se unen en un solo conjunto, el resultado
aún es un conjunto linealmente independiente. Por ejemplo, si se eligen tres
vectores linealmente independientes de un eigenespacio y dos vectores linealmente
independientes de otro, entonces los cinco vectores forman un conjunto
linealmente independiente. Se omite la demostración.
,,I,
Como una consecuencia del teorema 7.2.2 se obtiene el siguiente resultado
importante.
Teorema 7.2.3. Si una matriz A n
A es diagonalizable.
X
n tiene n eigenvalores distintos, entonces
Demostración. Si v l , v2, . . . , v, son los eigenvectores correspon&entes alos
eigenvalores distintos Al, A,, . . . , An, entonces por el teorema 7.2.2 se tiene que
vl, v2, . . . , v, son linealmente independientes. Así, A es diagonalizable debido al
teorema 7.2.1. 0
Ejemplo 3 En el ejemplo 2 de la sección precedente se vio que
tiene tres eigenvalores distintos, A
A es diagonalizable. Además,
= 4,
A
=
2
+ fi,A
=
2 - A.Por consiguiente,
7.2 Diagonalización / 433
4
0
o
o
:I
2-v3
para alguna matriz invertible P. Sise desea, la matriz P puede determinarse
usando el metodo del ejemplo 1 de esta sección. A
Ejemplo 4 Por el teorema 7.1.1, los eigenvalores de una matriz triangular son los
elementos desu diagonal principal. Así, una matriz triangular con elementos
distintos en la diagonal principal es diagonalizable. Por ejemplo,
-
A=[
-2
es una matriz diagonalizable. A
MULTIPLICIDAD
GEOMÉTRICA Y
MULTIPLICIDAD
ALGEBRAICA
El teorema 7.2.3 no determina completamente el problema de diagonalización, ya
que es posible que una matriz A n X n sea diagonalizable sin tener n eigenvalores
distintos. En el ejemplo 1 se vio esto, donde la matriz dada 3 X 3 tenía sólo dos
eigenvalores distintos, a pesar de lo cual era diagonalizable. Lo que realmente
importa para que una matriz sea diagonalizable son las dimensiones de los
eigenespacios: la suma de estas dimensiones debe ser cuando mucho n a fin de que
una matriz n X n sea diagonalizable. Los ejemplos 1 y 2 ilustran este hecho, las
matrices de estos ejemplos tienen la misma ecuación característica y los mismos
eigenvalores, pero la matriz del ejemplo 1 es diagonalizable porque la suma de las
dimensiones de los eigenespacios es 3, y la matriz del ejemplo 2 no es diagonalizable porque la suma de las dimensiones de los eigenespacios sólo es igual a 2.
La profundización en el estudio de las condiciones para diagonalización se
deja para cursos más avanzados, aunque se mencionará un teorema importante que
dará una comprensión más completa de las condiciones. Se puede demostrar que
si A. es un eigenvalor de A , entonces la dimensión del eigenespacio que corresaparece como factor
ponde a Ao.no puede exceder el número de veces que A - io
en el polinomio característico de A . Así, en los ejemplos 1 y 2 elpolinomio
característico es
(A- ])(A- 2 ) 2
Por tanto, el eigenespacio correspondiente a A = 1 es cuando mucho (y, por tanto,
exactamente) unidimensional y el eigenespacio correspondiente a A= 2 es a lo
sumo bidimensional. En e! ejemplo 1, el eigenespacio correspondiente a A = 2 en
realidad es de dimensión 2, lo cual da por resultado condiciones para la diagonalización, pero en el ejemplo 2 el eigenespacio sólo es de dimensión 1, lo cual indica
que no hay condiciones para la diagonalización.
Existe una terminología que relaciona las ideas anteriores. Si A. es un
eigenvalor de una matriz A n X n, entonces la dimensión del eigenespacio corres-
434
,'
Eigenvalores,eigenvectores
pondiente a ,lo se denomina multiplicidad geométrica de A, y el número de veces
que A - ,lo aparece como factor en el polinomio característico de A se denomina
mulfiplicidad algebraica de A . El siguiente teorema, que se enuncia sin demostración, resume el análisis precedente.
Teorema 7.2.4. Si A es una matriz cuadrada, entonces:
a ) Para todo eigenvalor de A la multiplicidad geométrica es menor o igual
que la multiplicidad algebraica.
6 ) A es diagonalizable si y sólo si la multiplicidad geométrica es igual a la
multiplicidad algebraica para todo eigenvalor.
CÁLCULO DE
LAS POTENCIAS
DE UNA MATRIZ
En matematicas aplicadas se presentan muchos problemas en los que es necesario
calcular potencias grandes de una matriz cuadrada. Esta sección concluirá mostrando cómo se puede usar la diagonalización para simplificar los cálculos.
Si A es una matriz n X n y P es una matriz invertible, entonces
(P"AP)2
= P"APP"AP
=P-
' A M P = P"A2P
De manera más general, para cualquier entero positivo k
(8)
' A P ) k ( P - ' A k P= P -
Por la ecuación (8) se concluye que si A es diagonalizable y P-lAP
matriz diagonal, entonces
'AkP-
lAP)k
= (P
=
di
=
D es una
(9)
DespejandoA k de esta ecuación se obtiene
I
I
La última ecuación expresa la k-ésima potencia de A en términos de la k-ésima
potencia de la matriz diagonal D. Pero calcular dc es fácil; por ejemplo, si
O
4
O
entonces
...
7.2 Diagonalización / 435
Ejemplo 5 Usando (lo), encontrar A 13, donde
i]
o
A=[!
-2
Solución. En el ejemplo 1 se mostró que la matriz A es diagonalizada por
o
-1
:
-2
:I
y]
D=P"..=[:
2 0 0
Así, por (lo),
[-p A
[
o
A'3=PD13P"
=
- 8190
:l[:
-2
O
213
o
:3
:'.I[-:
o
1
0
1
0
2
I]
-1
(11)
-16382
8191
8192
=
8191
O
16383
Con el método del ejemplo precedente casi todo el trabajo consiste en diagonalizar A . Una vez hecho ésto, se puede usar para calcular cualquier
potencia de A . Así, para calcular A loo0 basta cambiar el exponente de 13 a 1000
en laexpresión (11).
OBSERVACI~N.
EJERCICIOS DE LA SECCION 7.2
1. Sea A una matriz 6 X 6 con ecuación característica12(1- 1)(A
las dimensiones posibles para los eigenespacios deA?
2. Sea
- 2)3 = O. ¿Cuáles son
a) krlxwnlrar los eigellvalores de 11.
b) Para cada eigenvalor 1, determinar el rango de a
l matriz111 - <4
c) ¿,Esdiagonalizable A? Justificar In respuesta.
En los qercicios del 8 al 1 1. hallar una matriz P que diagonalice a A, y determinar P" AP.
3
cncontrar una matri7 P que diagonalice a A , y determinar P"AP
'I
o3
18. Con el mktodo del ejercicio 5 , calcular A", donde
19. Usar el metodo del ejercicio 5 para calcular A", donde
A=
[-A
: -"]
o
15
-2
20. En cada inciso, calcular la potencia indicada de
21. Encontrar 4 "
SI II
3
es un entero positlvo y
-1
4j
o
7.3 Diagonalización ortogonal / 43 7
22. Sea
Demostrar las siguientes proposiciones:
-+ 4hc > O.
a) A es diagonalizable si (a b) A no es diagonalizable si (a - 4' + 4hc < O.
[Sugerencia.Véanse los ejercicios 17 y 18 de la sección 7.1 . ]
23. En el caso en que la matnz A del ejercicio 22 es diagonalizable, encontrar una matriz P
que diagonalice a A .
24. Demostrar que si A es una matriz diagonalizable, entonces el rango de A es el número
de eigenvalores diferentes de cero de .4.
25. Demostrar: Si A es invertible y diagonalizable, entonces A" es diagonalizable y una
matriz P que diagonalice a A también diagonaliza a A".
7.3 DIAGONALIZACIÓN ORTOGONAL
En esta sección se abordará el problema de determinar una base ortonormal para
R" con el producto interior euclidiano,integrada por eigenvectores de una matriz
dada A n x n. Eltrabajo ya realizado sobre matricessimétricas y matrices
ortogonales desempeñará un papel importante aquí.
PROBLEMADE
LA DIAGONALIZACION
ORTOGoNAL DE
UNA MATRIZ
es demostrar que los dosproblemas siguientes
El primer objetivodeestasección
son equivalentes.
Problema del eigenvector ortonormal Cada una matriz A de n x n, ¿existe
una base ortonormal para R" con el producto interior euclidiano integrada por
eigenvectores de A?
~~~~
~~
Problema de la diagonalización ortogonal vorma matricial). Dada una matriz
A n X n, ¿existe una matriz ortogonal P tal que la matriz P"AP = PTAP es
diagonal? En caso de que exista la matriz. entonces se dice que A es diagonalizable ortogonalmente, y se dice que P diagonaliza ortogonalmente a A .
Para el segundo problema es necesario considerar dos preguntas'
e
o
¿Qué matrices son diagonalrmbles ortogonalmente?
LCómo encontrar una matriz ortogonal a fin de efectuar la diagonalización?
438 / Eigenvalores, eigenvectores
Con respecto a la primera pregunta, se observa que no hay ninguna posibilidad de diagonalizar ortogonalmente una matriz A a menos de que A sea simétrica
(es decir, A =AT).Para darse cuenta de este hecho, supóngase que
P'AP
=D
(1)
donde P es una matriz ortogonal y D es una matriz diagonal. Como P es
ortogonal, PPT = PTP = I, de modo que (1) se puede escribir como
Como D es una matriz diagonal, se tiene D
ambos miembros de (2) se obtiene
=
DT,de modo que al transponer
A T = (PDPT)T= (PT)TDTPT
= PDPT = A
así que A debe ser simétrica.
CONDICIONES
PARA DIAGONALIZACI~N
ORTOGONAL
El siguiente teorema muestra que toda matriz simétrica es, de hecho, diagonalizable ortogonalmente. En este teorema, y durante el resto de esta sección,
ortogonal sigruficará ortogonal con respecto al producto interior euclidiano sobre
R"
Teorema 7.3.1. Si A es una matriz n x n, entonces las siguientes proposiciones son equivalentes.
a) A es diagonalizable ortogonalmente.
b) A tiene un conjunto ortonormal de n eigenvectores.
c> A es simétrica.
Demostración de a * 6: Como A es diagonalizable ortogonalmente, existe una
matriz ortogonal P tal que P"AP es diagonal. Como se vio en lademostración del
teorema 7.2.1, los n vectores columna de P son eigenvectores de A . Puesto que P
es ortogonal, estos vectores columna son ortonormales (véase el teorema 6.5.1), de
modo que A tiene n eigenvectores ortonormales.
b * a Supóngase que A tiene un conjunto ortonormal de n eigenvectores { p
p2, . .. . , p,}. Como se vio en la demostración del teorema 7.2.1, la matriz P con
estos eigenvectores como columnas diagonaliza a A. Debido a que estos eigen-
vectores son ortonormales, P es ortogonal y, por tanto, diagonaliza ortogonalmente
aA.
a * c) En la demostración de a * b se probó que una matriz A n x n diagonalizable ortogonalmente es dagonalizada ortogonalmente por una matriz P n X
n cuyas columnas forman un conjunto ortonormal de eigenvectores de A . Sea D la
matriz diagonal
7.3 Diagonalización ortogonal / 439
D = P “AP
Así,
A
= PDP-]
o bien, ya que P es ortogonal,
A
= PDPT
Por consiguiente,
A T = (POPT)’= PDTPT= PDPT= A
lo cual demuestra que A es simétrica.
c + a ) La demostración de esta parte rebasa el alcance de este texto, por lo que se
omitirá. 0
ALGUNAS
PROPIEDADES
DE LAS
MATRICES
SIMÉTRICAS
El siguiente objetivo es establecer
un procedimiento para diagonalizar ortogonalmente una matriz simétrica, pero antes de hacerlo se requiere un teorema crucial
sobre eigenvalores y eigenvectores de matrices simétricas.
Teorema 7.3.2. Si A es una matriz simétrica, entonces:
a ) Todos los eigenvalores de A son números reales.
6) Eigenvectores de eigenespacios diferentes son ortogonales.
Demostración de a).La demostración del inciso a ) , que requiere resultados sobre
espacios vectoriales complejos, se analizará en la sección 10.6.
Demostración de 6). Sean v1 y v2 eigenvectores correspondientes a eigenvalores
distintos A , y A, de la matriz A . Se quiere demostrar que v, v, = O. La demostración de este hecho requiere empezar con la expresión Av, * v,. Por la fórmula (8)
de la sección 4.1 y la simetría de A se concluye que
Pero v, es un eigenvector de A correspondiente a Al y v2 es un eigenvector de A
corresponhente a A,, de modo que (3) produce la relación
A , V ] . v2 = V ]
que se puede volvera escribir como
A*vz
-130
Eigenvalores,
eigenvectores
( A
-
A2)(VI
.v2) =o
(4)
Pero A l - 1, f O, ya que se supone que A, y A2 son distintos. Así, por (4) se
concluye que v1 v2 = O. 0
+
O B S E R V A C I ~ N . El lector
debe recordar que hasta el momento se ha supuesto
que todas las matrices tienen elementos reales. De hecho, en el capitulo 10 se
verá que el inciso a) del teorema 7.3.2 es falso para matrices con elementos
complejos.
DIAGONALIZACION DE
MATRICES
SIMÉTRICAS
Como una consecuencia delteorema precedente se obtiene el siguiente procedimiento para diagonalizar ortogonalmente una matriz simétrica.
Paso 1.
Baso 2.
Paso 3.
Encontrar una base para cada eigenespacio de A .
Aplicar el proceso de Gram-Schmidt a cada una de estas bases a fin
de obtener una base ortonormal para cada eigenespacio.
Formarlamatriz
P cuyas columnasson
los vectores básicos
obtenidos en el paso 2; esta matriz diagonaliza ortogonalmente a
A .
La justificación de este procedimiento debe ser evidente: El teorema 7.3.2 asegura
que los eigenvectores de eigenespacios drferenfes son ortogonales, mientras que la
aplicación del proceso de Gram-Schmidt asegura que los eigenvectores obtenidos
del murno eigenespacio son ortonormales. Así, todo el conjunto de eigenvectores
obtenidos con este procedimiento es ortonormal.
Ejemplo 1 Encontrar una matriz ortogonal P que diagonalice a
Soluci6n.
La ecuación característica de A es
det(A1-A)=det
["-: 1:
-2
A-4
-2
=(A-2)2(A-8)=0
Así, los eigenvalores de A son A = 2 y il = S. Por el método usado en el ejemplo S
de la sección 7.1, se puede demostrar que
uF[-;]
y
%=[
-;]
7.3 Diagonalizacidn ortogonal / 441
forman una base para el eigenespacio correspondiente a X = 2. Aplicando el proceso de Gram-Schmidt a {u1, u2$ se obtienen los siguientes eigenvectores ortonormales (comprobar):
v,
[
=
-
l/v?
y
l/ofi]
El eigenespacio correspondiente a X
=8
v2=
tiene a
como base. Aplicando el proceso de Gram-Schmidt a {u3} se obtiene
I
Finalmente. usando a v l , v2 y v3 como vectorescolumna se obtiene
-l/u2
l/v?
p = [
-116
116
l/V5
l/v3
2 / d
1/%5
-
O
que diagonaliza ortogonalmente a A . (Como comprobación, el lector debe verificar
que PTAP es una matriz diagonal.) A
EJERCICIOS DE LA SECCIÓN 7.3
1. Encontrar la ecuación característica de la matriz simétrica dada, y luego por inspección
determinar las dimensiones de los eigenespaclos
df
2
: '1
2
4
4
4
0
0
e ) [4
O o]
0 0 0 0
0 0 0 0
f)
o
[-: ;
2
0
-1
0
;
-I
-;I
En los ejercicios del 2 al 9, encontrar una matriz P que diagonalice ortogonalmente a A , y
determinar P"AP.
442 / Eigenvalores, eigenvectores
6. A =
[
1 1 0
I 1 O]
O 0 0
‘1
::
I!]
7. A = [ : !
-7
3 1 0 0
8. A = [ ’ O 0 o0 0
9. A = [
O 0 0 0
10. Suponiendo que b f O, encontrar una matriz que diagonalice ortogollalmente a
11. Demostrar que si A es cualquier matnz m
ortonormal de n eigenvectores.
X
para matrices simétncas 2
X
O
n, entonces ATA tiene un conjunto
12. a) Demostrar que si v es cualquier matnz n X 1 e I es lamatrizidentidad
entonces Z - w Tes diagonalizable ortogonalmente.
b) Encontrar una matrizP que diagonalice ortogonalmente aI - w Tsi
13. Usando el resultado del ejercicio
n
X
n,
17 en la sección 7.1, demostrar el teorema 7 . 3 . 2 ~
2.
EJERCICIOS COMPLEMENTARIOS
1. a) Demostrar que si O < 0 < n,entonces
A=
[
1
cos 0
-sen 0
sen 8
cos 8
24O
no tiene eigenvalores y en consecuencia no tiene eigenvectores.
b) Proporcionar una explicación geométrica del resultado del inciso
a)
2. Encontrar los eigenvalores de
con elementos no negativosen la
diagonal principal, entonces existe una matriz S tal que S’ = D.
b) Demostrar que si A es una matriz diagonalizable con eigenvalores no negativos,
entonces existe una matnz S tal que S’ = A .
c) Encontrar una matriz S tal que S’ = A si
3. a) Demostrar que si D es unamatrizdiagonal
O
O
O - 70
7
O 2 4
24
O
7
24
Ejercicios complementarios / 443
4. a) Demostrar: Si A es una matriz cuadrada, entonces A y AT tienen los mismos eigen-
valores.
b) Demostrar que A y AT nonecesariamentetienenlosmismoseigenvectores.
[Sugerencia Usando el ejercicio 18 de la sección 7.1, encontrar una matriz A 2
tal que A y AT tengan eigenvectoresdiferentes.]
X
2
5. Demostrar: Si A es una matriz cuadrada y p(1) = det(1Z - A ) es el polinomio característico de A, entonces el coeficiente de 1"" enp(1) esel negativo dela traza deA .
6. Demostrar: Si b
O, entonces
#
no es diagonalizable.
7. En algebra lineal avanzada se demuestra el teorema de Cayley-Hamilton, que establece que una matriz cuadradaA satisface su ecuación característica;es decir, si
co+cla+c~a~+~~~+c~~,~-~+a~=o
es la ecuación característica de A , entonces
col
+ c,A + c2A2+ . . . + cn- ,A"-' + A" = O.
Comprobar este resultado para
O
1
1
-3
0
3
En las ejercicios 8, 9 y 10, usar el teorema de Cayley-Hamilton enunciado en el ejercicio7.
8. Usando el ejercicio 16 de la sección 7.1, demostrar
paramatrices2
X
el teoremadeCayley-Hamilton
2.
9. El teorema de Cayley-Hamilton proporciona un método eficiente para calcular potencias de una matnz. Por ejemplo, si A es una matriz2 X 2 con ecuación característica
co
+
entonces cJ
+
a2
=o
+ c,A + A2 = O, de modo que
A 2 = -cIA - c o l
Multiplicando todo por A se obtiene A3 = -c,A2 - e&, que expresa A3 en términos de
A2 y A , y multiplicando todo por A2 se obtiene A4 = -c1A3 - c a z , que expresa A4 en
términos de A3 y A2. Continuando de esta manera es posible calcular potencias consecutivas deA expresándolas simplemente en términos de potencias inferiores. Usando
este procedimiento, calcular
A2, A 3 , A4,
y
As
444 1 Eigenvalores, eigenvectores
para
10. Usando el método del ejercicio precedente, calcularA3 y A4 para
11. Encontrar los eigenvalores de la matriz
12. a) En elejercicio 15 de la sección 7.1 se demostró que si A es unamatriz n X n,
entonces el coeficiente de A" en elpolinomio característico de A es 1. (Un polinomio
con esta propiedad se denomina mdnico.) Demostrar que la matriz
demuestraque todo polinomio mónico esel polinomio característico de alguna
matriz. La matriz de este ejemplo se denomina mutriz acompmlunfe de p(ll).
Sugerencia Evaluar todos los determinantes del problema sumando un múltiplo
delsegundorenglónalprimerrenglón
a fm de introducir un cero en la parte
superlor de la primera columna, y luego desarrollar por cofactores a lo largo de la
primera columna
b) Encontrar una matriz con polinormo característico p(L) = 1 - U + ,I2 + 3L3 + 1'.
13. Una matm cuadrada A se denomina nilpotente si A" = O para algún entero positivo n.
¿,Quépuede afirmar el lector sobre los eigenvalores de una matriz nilpotente?
14. Ikmostrar: Si A es una matriz n
X II y n
es impar, entonces A tiene por lo menos un
eigenvalor real.
15. Encontrarunamatriz
A de 3
elgenvectores correspondientes
respectivamente.
X
3 que tenga los eigenvalores 1 = O, 1 y
- 1 con
Ejercicios complementarios / 445
16. Supóngase que una matriz A 4 X 4 tiene los eigenvalores A l = 1, l 2= -2, 1, = 3 y
= -3.
a) Usando el ejercicio 14 de la sección 7.1, encontrar dei;.A).
b) IJsando el ejercicio 5 de esta sección, determinar tr(A).
17. Sea A una matriz cuadrada
elgenvalores de A?
tal que A3 = A. ¿Qué puede afirmar el lector sobre los
8
CAPITULO
TRANSFORM4CIONES
LINEALES
8.1
TRANSFORMACIONESLINEALESGENERALES
En las secciones 4.2 y 4 . 3 se estudiaron Iransformaciones lineales de R" a
R". En esta sección se definirán y estudiarán transformaciones lineales de un
espacio vectorial V a un espacio vectorial W. Los resultados tienen aplicaciones
importantes en fisica, ingeniería y varias ramas de las matemáticas.
DEFINICIONES Y
TERMINOLOGÍA
Recuérdese que una transformación lineal de R" a Rm se definió como una función
w , , x2,
. . . ,x,)
=(
y , w2,. . . , w m )
en la cual las ecuaciones que relacionan a wl, w2,. . . , wm y xl, xz, . . . , x, son
lineales. Luego se demostró que la transformación T:Rn i* R" es lineal si y sólo si
a
ls siguientes relaciones se cumplen para todos los vectores u y v en R" y cualquier
escalar c (véase elteorema 4.3.2):
T(u + v) = T(u) + T(v)
T(cu) = cT(u)
Definición. Si T:V * W es una función de un espacio vectorial V a un espacio
vectorial W, entonces T se llama transformación libzealde Va W si para todos
los vectores u y v de V y todos los escalares c se cumple que
+
a) T(u v) = T(u)
b) T(cu) = cT(u)
+ T(v)
En el caso especial donde V = W, la transformación lineal T:V * V se denomina
operador lineal sobre V.
44 7
Estas propiedades se usarán como punto de partida para el estudio de las transformaclones linealcs generalcs.
EJEMPLOS DE
TRANSFORMACIONES
LINEALES
E,jemplo 1 Debido a que la definiciónanteriordetransformaciónlinealsebasaenel
teorema 43.2, l a s transformacioneslinealesde R" aR",segúnsedefinieronenla
sección 4.2, también
son
transformaciones
lineales
bajo esta
definición más general. A las
transformacioneslinealesde Hn a R" selesllamará
trunsformucwnesmatricides, ya
que se pueden efectuar por m d o de multiplicación de matrices. A
Ejemplo 2 Sean G
' y E' dos espacios vectoriales cualesquiera. El mapeo T:V + W
tal que ?'(v) = O para todo v en V es una transformación lineal denominada transformación cero.Para darse cuenta que 7' es lineal, obsérvese que
P(u + v ) = o, 7'(u) = o.
T(v) = o,
y
T ( k u )= o
Por consiguicnte.
T ( u + V) = T ( u ) + T ( v )
y
T ( k u )= k T ( u ) A
Ejemplo 3 Sea J'cualquier espacio vectorial. El mapeo I:V + V definido por I(v)
v se llama operador identidad sobre b'. La comprobación de que I es lineal sc
dejacomo qercicio. A
=
Ejemplo 1 Sea I' cualquier espacio vectorial y k cualquier escalar fijo. Se deja
como ejercicio comprobar que la función 7 I.' + C'definida por
T(v) = kv
es un operador lineal sobre 1'. Este operador lineal se conoce como dilatación de P.
con factor k si k > 1, y como contracción de V con factor k si O < k < 1
Geométricamente. la dilatación "estira" a cada vector de T' por un factor k . y la
contracción de L '"comprime" a cada vector de I' por un factor k (figura 1). A
8. I Transformaciones lineales generales / 449
Ejemplo 5 En la sección 6.4 se definió la proyección ortogonal de R"' sobre un
subespacio W. [Véase la fórmula (6) y la definición precedente a ésta en dicha sección.]Las proyecciones ortogonales también se pueden definir enespacios
generales con producto interior como sigue: Supóngase que W es un subespacio de
dimensión finita de un espacio V con producto interior; entonces la proyección
ortogonal de Vsobre W es la transformación definida por
(figura 2). Por el teorema 6.3.5 se deduce que si
S = {WI,
w2, . . . , w,)
es cualquier base ortonormal para W , entonces T(v)está definido por la fórmula
T ( v ) =proyw v
= (v,
wI)w,-1 (v, w2)w2+ . . . + ( v . w,)~,
La demostración de que T es una transformación lineal es consecuencia de las
propiedades del producto interior. Por ejemplo,
T(u + v)
+ v, Wl)Wl+ (u + v, w2)w*+ + (u + v, WJW,
= (u,W,)Wl
+ (u, w2)w2 + . + (u, WJW,
= (u
' ' '
' '
+ ( v , WI)W,+ ( v , W2)WZ +
=
T(u)
' ' '
+ (v, WJW,
+ T(v)
De manera semejante, T ( h ) = kT(u). A
Ejemplo 6 Comouncasoespecialdelejemplo
anterior, sea V = R3 con el
producto interior euclidiano. Los vectores w 1 = (1, O, O) y w2 = (O, 1, O) forman
una base ortonormal del plano xy. Por tanto, si v = (x, y , z) es cualquier vector en
R3, entonces la proyección ortogonal de R3 sobre el plano xy está dada por
T(v)
= (v,
w,)WI + (v, W2)WZ
= x ( 1 , o, 0) + Y a 1, 0)
= (X>Y , 0)
$50
7iansjorrnaclones lineales
(Véase Pa figura 3 .) A
F~~~~~
IProyección ortogonal de R3 sobre el plano I
xy.
Ejemplo 7 Sea S = {wl, w2, . . . , w,,} una base deun espacio vectorial V de
dimensión n, y sea
(V).? =
( k , , k2 , . .
' 1
el vector de coordenadas con respecto a S de un vector v en Y; así
v = k,w, + k2w2 + . . . + k,w,,
Se define 1': L' -+ K" como la función que mapea v en su vector de coordenadas con
respecto a S; es decir,
La función T es una transformación lineal. Para darse cuenta de que así es, supóngase que u y v son vectores en Y y que
Así,
Pero
u+V
+ d,)w,+ (c2+ d,)w, + . . . + (c, + dn)w,
ku = (kc,)w,
+ (kc2)w2+ + kc,)^,
=
(c.,
I
.
.
de modo que
(u + v ) =
~ ( c , + d , , c2 + d,, . . . , C,
(kuj,
=
( k c , , kc,, . . . , kc,)
+ d,,)
8.1 Transformaciones linealesgenerales / 451
Por consiguiente,
Al expresar estas ecuaciones en términos de T. se obtiene
T(u + v) = T(u)+ T(v)
y
T(ku) = kT(u)
lo cual demuestra que T es una transformación lineal. A
Los cálculos del ejemplo anterior también se pudieron haber
realizado usando matrices de coordenadas en lugar de vectores de coordenadas; es
decir,
OBSERVACI~N.
Y
T(p) = T ( p ( x ) )= x p ( x ) = cox
+ c1x2 +
' ' '
+ C,X,+l
La función T es una transformación lineal, ya que para cualquier escalar k y
polinomios cualesquiera p1 y pz en P, se tiene
Y
Ejemplo 9 Sea p = p ( x ) = co + cIx + . . . + c,$' un polinomio en P , y sean a y b
n,
escalares cualesquiera. Se deja como ejercicio demostrar que la funclon
T definida
Por
T(p) = T ( p ( x ) )= p ( u x
+ b) = co + c,(ax + b ) + . . . + c,(ax + b)"
4.52
Transformaciones lineales
Ejemplo 10 Sea V un espacio con producto interior y sea vo cualquier vector fijo
en V. Sea T:V + R la transformación que mapea un vector v en su producto
interior con vo; es decir,
T(v) = (v, vo )
Por las propiedades de producto interior,
T ( u + v) = ( u + v,
Vo>
= (u, vo)
+ ( v , vO)= T(u) + T(v)
Y
T ( k u ) = (ku, v")
= k( u,
vo>= kT(u)
de modo que T es una transformación lineal. A
Ejemplo 11 (Para quienes y a estudiaron Cálculo). Sea V = C1(-m, m) el
espacio vectorial de funciones con primeras derivadas continuas sobre (- m , m), y
sea W = F( - m , m) el espacio vectorial de todas las funciones con valores reales
definidas sobre (- C Q , m). Sea D:V + W la transformación que mapea una función
f =fix) en su derivada; es decir,
D(f) =
y(.,
Por las propiedades de derivación se tiene que
Y
D(kf)
= kD(f)
Así. D es una transformación lineal. A
Ejemplo 12 (Para quienes ya estudiaron Crilculo). Sea V = C(- m, m) el espacio vectorial de funciones continuas sobre (- m , m), y sea W = C1(- m , m) el espacio vectorial de funciones con primeras derivadas continuas sobre (- m , m). Sea
J:T' + W la transformación que mapea f =Ax) en la integral
Por ejemplo, si f = 2 entonces
Por las propiedades de la integración se tiene que
8.1 Transformaciones lineales generales / 453
J ( c f ) = j : c f ( t ) d t = ~ [O f ( t ) d r = c J ( f )
de modo que J es una transformación lineal. A
Ejemplo 13 Sea TM,,
su determinante; es decir
+R
la transformación que mapea una matriz n
X
n en
T(A) = det(A)
Esta transformación no satisface ninguna de las propiedades necesarias para ser
una transformación lineal. Así, en el ejemplo 1 de la sección 2.3 se vio que
det(A, + A 2 ) # det(A,) + det(A2)
en general. Además, det(cA)= c"det(A), de modo que
det (cA) f cdet ( A )
en general. Por tanto, T no es una transformación lineal. A
PROPIEDADES
DE LAS
TRANSFORMACIONES
LINEALES
Si T:V + W es una transformación lineal, entonces para vectores cualesquiera v1 y
v2 en V y escalares cualesquiera c1 y c2 se tiene que
T(c,v,+ c2v2) = T(c,v,)+ T(c,v,)
= c,T(v,)
+ CJ(V2)
y de manera más general, si vl, v2, . . . , v, son vectores en V y cl, c2,. . . , c, son
escalares. entonces
T(c,v,+ c2v2 +
' ' '
+ c,v,)
= c,T(v,)
+ c2T(v2)+
'
. . + c,T(v,)
(1)
La fórmula (1) algunas veces se describe diciendo que las transformaciones
lineales conservan las combinacioneslineales.
En el siguiente teorema se enumeran tres propiedades básicas comunesa
todas las transformaciones lineales.
Teorema 8.1.1. Si T:V + W es una transformación lineal, entonces
a) T(0) = o
b ) T( - v) = - T(v)para todo v en V.
c) T(v - w) = T(v)- T(w) para todo v y w en V.
454
,'
Transformacioneslineales
Demostración.
Sea v cualquier vector en V. Como Ov = O, se tiene
T ( 0 ) = T(0v) = OT(V) = o
io cual demuestra el inciso a). Tambitn,
T( -v)
=
T((" 1)v) = ( - l)T(v) = - T(v)
lo cual demuestra el inciso 6). Finalmente, v - w = v + (- 1)w; así
T(v - w)
=
=
=
lo cual demuestra el inciso e),
T(v
+ (-
1)w)
T(v) + ( - l)T(w)
Z(V) - T(w)
0
En palabras, el inciso a ) del teorema anterior establece que una transformación lineal mapea O en O. Esta propiedad es útil para identificar transformaciones
que no son lineales. Por ejemplo, si % es un vector fijo diferente de cero en R2,
entonces la transformación
T(x)= x
+ x,,
tiene el efecto geométrico de trasladar cada punto x en una dirección paralela a x.
por una distancia llxo/l (figura 4). Esta no es una transformación lineal, ya que T(0)
= xo, de modo que T no mapea O en O .
8.I Transformaciones lineales generales
DETERMINACIóN DE
TRANSFORMACIONES
LINEALES A
PARTIR DE LAS
IMÁGENES DE
LOS VECTORES
BÁSICOS
/
455
El teorema 4.3.3 demuestra que si 7 es una transformación matricial, entonces es
posible obtener la matriz estándar de T a partir de las imágenes de los vectores
estándar básicos. Mencionado de otra manera, una transformación matricial está
completamente determinada por las imágenes de los vectores estándar básicos.
Este es un caso especial de un resultado más general: Si T:V + W es una transformación lineal, y si { v l ,v2, . . . , vn} es cualquier base de V, entonces la imagen
T(v) de cualquier vector v en V se puede calcular con las imágenes
de los vectores básicos. Esto se hace al expresar primero a v como una combinación lined de los vectores básicos, por ejemplo,
v
= C,Vl
+ C2V* +
' '
. + c,v,
y luego usar la fórmula (1) para escribir
Expresado en palabras, una transformación lineal está completamentedeterminada por lasimágenes de vectores básicos cualesquiera.
Ejemplo 14 Considerar la base S = {vl, v2,v3} para R3, donde v1 = (1, 1, l), v2
= (1, 1, O), v3 = ( 1, O, O); y sea T:R3+ R2 la transformación lineal tal que
Obtener una fórmula para T ( x l ,x2, x3);luego, usar esta fórmula para calcular T(2,
- 3 , 5).
Solucidn. Primero, x = (x1, x2, x3) se expresa como una combinación lineal de v1
= (1, 1, l), v2 = (1, 1, O) y v3 = ( 1, O, O). Si se escribe
entonces la igualación de las componentes correspondientes produce
456
,/'
Transformaciones lineales
Por tanto.
T(.u,, x2, x
i
+ ( x 2 - -Y3 IT@,) + (x, - X 2 ) T ( V 3 )
O) + (x2 - -Y3 )(2, - 1 ) + (x, - x2)(4,3 )
= -u,T(v,)
= -u,(
-
1,
(4a,
-
2.5
- x j , 3.Yl
-
4s2
+ x3)
A partir de esta fórmula se obtiene
T(2.
COMPOSICIONES
DE TRANSFORMACIONES
LINEALES
~~
3. 5 ) = (9. 2 3 ) A
En la sección 4.2 se definió la composición de transformaciones matriciales. La
siguiente definición amplía elconcepto a transformaciones lineales generales.
7,:
Definición. Si Ti: I/ + V y
V + W son transformaciones lineales, la composición de T2 con TI denotada por T . o T I (que se lee como " T , seguida de
7;").
es la función definida por la fórmula
I donde u es un vector en U.
Nótese que esta definición requiere que el dominio de T, (el cual
es 1),' contenga al recorrido de T,;este hecho es esencial para que la expresión
T,(T,(u))tenga sentido (figura 5). El lector debe comparar (2) con la fórmula (18)
de la sección 4.2.
OBSERVACI~N.
Figura 5
El siguiente resultado muestra que la composición de dos transformaciones
lineales es una transformación lineal.
y 12:1. -+. W son transformaciones lineales, entonces (Tz T I ) :li + W también es una transformación lineal.
Teorema 8.1.2. S i 1',: 5 +
0
Uemostracibn. Si u y v son vectores en U y c es un escalar, entonces por (2)
linealidad de T, y T
. se deduce que
la
8. I Transformaciones lineales generales
I
45 7
Y
Ejemplo 15 Sean T,:P,
definidas por las fórmulas
+
P, y T,:P,
T I ( P ( 4 )=x&)
-+
Y
P, las transformaciones lineales
T,(P(X)) = P(2X
+ 4)
Entonces la composición (T, T,):P, + P, está definida por la fórmula
0
En particular, si p ( x ) = co + cIx. entonces
Ejemplo 16 Si T:V + Ves cualquier operador lineal y si Z:V + Ves el operador
identidad (ejemplo 3), entonces para todos los vectoresv en V se tiene
( T o I)(v) =
T(Z(v))= T ( v )
( I o T ) ( v ) = I ( T ( v ) )= T ( v )
En consecuencia, T , I e I o T I son iguales a
0
r; es decir,
A
Esta secciónconcluye haciendo notar que las composicionessepueden
definir para más de dos transformaciones lineales. Por ejemplo, si
T I : U+ V,
T2 V+ W,
son transformaciones lineales, entonces la
como
( T 3 o T2 o
)(u>=
y
T 3 : W+Y
composición T3 T2 T I se define
0
T3(T2(Tl(u)))
0
(4)
158 ;’ Transformaciones lineales
Composición de trestransformaciones lineales.
Figura 6
EJERCICIOS DE LA S E C C I ~ N8.1
1. Con la definición de operador lineal proporcionada en esta sección, demostrar que la
función T S 2 + R2 deffida por la fórmula T(x,, 3)= (x, + 2.5, 3x, - x2) es un ope-
rador lineal.
2. Por medio de la definición de transformación lineal que se dio en esta sección, demostrar que la función TB3 + R2 expresada por la fórmula T(x,,%, x3) = (2x, - x2 +
x3, x2 - 4 5 ) es una transformación lineal.
En los ejercicios del 3 al 10, determinar si la función es una transformación lineal. Justificar las respuestas.
3. T: V + R, donde Ves un espacio con producto interior y T(u) = IIuII.
4. T:R3+ R3, donde vo es un vector fijo en R3 y T(u)= u X vo
5. ‘M2*
+
MZ3,donde B es una matnz fija 2
6. TM
:,
+ R, donde
7. TM,,
+ M,,
X
3 y T(A)= AB
T(A)= &(A).
donde F(A) = A T
8. TM2, + R, donde
9. KP,
+ P,,
donde
a) T(u, + u,x + u Z x 2 )= a,, + a,(x + I ) + u2(x + 1)’
b) T(a,, + u,x + u g 2 ) = (ao+ 1) + ( a ,+ 1)x + (u2 + 1)x2
10. T:F(-m, 00) ? * F ( - w ,
a) KH.4) = 1
+f(4
m),
donde
b) T(f(x))
= f(x
+ 1)
I
8.1 Transformaciones lineales generales
11. Dcmostrar que la función T en el ejemplo 9 es un operador lineal
12. Considérese la base S = {y1, vz) para HZ,donde v, = ! .
j
1 v2 = ( I , O), y sea T:Rz +
R2 el operador lineal tal que
T(v,)= (1, -2)
y
T ( v , ) = ( - 4 , 1)
Obtener una fórmula para T ( x l ,x2) y usarla para encontrar T(5, - 3 ) .
13. Considérese la base S = {vl, v2} para R2, donde v1 = (-2, 1) y v2 = (1, 3), y sea TB2
R3 la transformación lineal tal que
-f
Encontrar una fórmula para T ( x l ,x2) y usarla para calcular T(2, - 3)
14. Considérese la base S = {vl, v2, v3} para R3, donde v1 = (1, 1, 1 ), vz = ( 1 , 1 , O) y v3 =
( 1, O, O) y sea TB3+ R3 el operador lineal tal que
Obtener una fórmula para T ( x l ,x2, x3) y usarla para calcular T(2,4, - 1)
15. Considérese la base S = {vI,v2, v3} para R3, donde v1 = (1, 2, l), vz = (2, 9, O) y v3 =
(3, 3 , 4 ) y sea TB3+ R2 la transformación lineal tal que
hallar una fórmula para T ( x l ,xz, x3) y usarla para evaluar T(7, 13, 7)
16. Sean vl, v2 y v3 vectores en un
lineal para la que
espacio vectorial V y T:V += R3 una transformación
1
459
460 / Transformacionzs lineales
a) Encontrar ( T , 0 T J A ) , donde A
=
[::]
b) ¿Puede el lector obtener (T2 0 T,)(A)?Explicar la respuesta
20. Sean T,:P,
+ Pn y T,:P, + Pn l o s operadores lineales definidos por T , ( p ( x ) )= p ( x
- 1) y T,(p(x)) = p ( x + 1). Encontrar ( T I 0 T,)(p(x)) y (T2 0 T,)(p(x)).
21. Sea T,:V + V la dilatación T,(v) = 4v. Encontrar un operador lineal T,:V
T I 0 T , = I y T, 0 TI = 1.
+
V tal que
22. Suponer que a
lstransformaciones heales TI.Pz + P2 y T2F3+ P, están defindas por las
fórmulas T,(p(x)) = p(x + 1 ) y T2(p(x))= x&). Encontrar (T, 0 Tl)(ao+ aix+ up’).
23. Sea qo(x) un polinomio fijo de grado m ,y la función T con dominio Pn definida por la
fórmula T(p(x))= p(q,(x)).
a) Demostrar que T es una transformación lineal. b) ¿Cuál es el codominio de T ,
24. Con la definición de T3 0 T2 0 TI dada por la fórmula (4), demostrar que
a) T3 T2 0 TI es una transformación lineal.
b) T 3 o T 2 o T I = ( T 3 0 T 2 ) o T l
c) T 3 0 T 2 0 T 1 = T 3 0 ( T 2 0 T I )
0
25. Sea T:R3+ R3 la proyección ortogonal de H3 sobre el plano q.
Demostrar que T 0 T = T
26. a) Sean T :V + W una transformación lineal y k un escalar. La función ( k g :V + W se
define como (k1](v)= k(T(v)). Demostrar que kT es una transformación lineal.
b) Encontrar ( 3 T ) ( x , ,x 2 ) si T:R2 + R2 está expresada por la fórmula T ( x l , xz) =
@x1 - X,’ x2+x1>.
27. a) Sean T,:V + W y T2:V + W transformaciones lineales. Las funciones ( T , + T2):Y
W y ( T I - T J :V + W se definen como
(TI + T 2 ) W =
(T, - T2)W
=
+
+ T2W
TI(V) - TAv)
Demostrar que T I + T2 y T , - T2 son transformaciones lineales.
b) Encontrar (TI + T2)(x, y ) y (TI - í“,)(x, y ) si TI2’ + R2 y T2:R2+ R2 están
definidas por las fórmulas TI@, y ) = (2y, 3x) y T2(x,y ) = (y,x).
28. a) Demostrar que si a l , a2, b , y b, son escalares cualesquiera, entonces la fórmula
m
, Y ) = @,x
+ blY, a2x + b2Y)
defme un operador lineal sobre R2.
b) ¿La fórmula F(x,y ) = (up? + b,y2,‘.u,
Explicar la respuesta.
+ b p 2 )define un operador lineal sobre R2?
29. (Para quienes y a estudiaron Cálculo). Sean
D(f) = f’(xj
y
J(f) = j ; i ( t j dt
8.2 Núcleo y recorrido í 461
las transformaciones linealesde los ejemplos 11 y 12. Encontrar (J 0 0x0 para
a) f(x) = x'
+ 3x + 2
b) f(x) = senx
c) f(x) = x
30. Sea {v,, v,, . . . , vn} una base de un espacio vectorial V y sea T V +- Wuna transformación lineal. Demostrar que si T(v,)= T(v,) = ' . . = T(v,) = O, entonces T es la transfor-
mación cero.
. . . , vn} una base de un espacio vectorial V y sea T:V -* V un operador
lineal.Demostrar que si T(v,) = v,, T(v,) = v,, . . . , T(vn)= Y", entonces T es la
transformación identidad sobre V.
31. Sea {v,, v,,
8.2 NúCLEO Y RECORRIDO
En esta sección se ampliarán algunas propiedades básicas de las transformaciones lineales que generalizan propiedades, y a obtenidas en el texto, de las transformaciones matriciales.
NÚCLEO Y
RECORRIDO
Recuérdese que si A es una matriz m x n, entonces el espacio nulo de A consta de
todos los vectores x en R" tales que Ax = O y, por el teorema 5.5.1, el espacio
columna de A consiste en todos los vectores b en Rm para los cuales existe por lo
menos un vector x en R" tal que Ax = b. Desde el punto de vista de las transformaciones matricides, el espacio nulo de A consta de todos los vectores x en R"
que la multiplicación por A aplica o mapea en O, y el espacio columna consta de
todos los vectores en Rm que son imágenes de por lo menos un vector en R" bajo la
multiplicación por A . La siguiente definición amplía estas ideas a transformaciones lineales generales.
~~
~
Definición. Si T:V + W es una transformación lineal, entonces el conjunto de
vectores en V que T mapea o transforma en O se denomina núcleo (kernel o
espacio nulo) de T, y se denota por ker(7). El conjunto de todos los vectores en
W que son imágenes bajo 7' depor lo menos un vector en V se denomina
recorrido de T y se denota por R(7).
Ejemplo 1 Si TA:R" + R"' es la multiplicación por la matriz A m X n, entonces
por el análisis que precede a la definición anterior, el núcleo de 'T es el espacio
nulo de A y el recomdo de T, es el espacio columna de A. A
Ejemplo 2 Sea T:V + W la transformación cero (ejemplo 2 de la sección 8.1).
Como T mapea todo vector de Ven O, se concluye que ker(Q = V. Además, como
O es la Única imagen bajo T de los vectores en V, se tiene que R ( n = { O } . A
Ejemplo 3 Sea I:V + Vel operador identidad (ejemplo 3 de la sección 8.1). Como
I(v) = v para todos los vectores de V, todo vector en Ves la imagen de algún vector
462
Transformaciones
lineales
(a saber, éI mismo); así, R ( 0 = V. Como el linico vector que I mapea en O es O, se
concluye que ker(l) = ( O } . A
Ejemplo 4 Sea 1':R3 * K3 la proyección ortogonal sobre el plano xy. El núcleo de
7' es el conjunto de puntos que T transforma en O = (O, O, O); se trata de los puntos
sobre el eje z (figura l a ) . Como T mapeatodo punto de R3 en el plano x y , el
recorrido de T debe ser algún subconjunto de este plano. Pero todo punto (xo, yo,O)
en el plano xy es la imagen bajo í" de algún punto; de hecho, es la imagen de todos
los puntos sobre la recta vertical que pasa por (xo, yo, O) (figura lb). Por tanto,
R ( n es todo el plano xy. A
Y
Ejemplo 5 Sea T:R2 -z R2 el operador lineal que hace girar a todo vector en el
plano xy por un ángulo 8 (figura 2). Como todo vector en el plano xy se puede
obtener al girar algún vector por un ángulo 8 (¿por qué?), se tiene que R(T) = R2.
Además, el Único vector que gira en O es O, de modo que ker(T) = { O } . A
Ejemplo 6 (Para quienes ya estudiaron CúZcuZo). Sea V = C1(-CQ, CQ)el espacio
vectorial de funciones con primeras derivadas continuas sobre (- m , m ) , sea W =
F(- CQ.m) el espacio vectorial de las funciones con valores reales definidas
sobre ( - m , CQ) y sea D:V W la transformación derivación D a = f(x). El núcleo
de D es el conjunto de funciones en V cuya derivada es cero. Por Cálculo, se trata
del conjunto de funciones constantes sobre (- CQ, 00). A
8.2 Núcleo y recorrido / 463
PROPIEDADES
DEL NÚCLEO
Y DEL
RECORRIDO
En todos los ejemplos anteriores, ker(7) y R(7) resultaron ser subespacios. En los
ejemplos 2, 3 y 5 fueron el subespacio cero o todo el espacio vectorial. En el
ejemplo 4 el núcleo era una recta que pasa
por
el
origen y el recorrido era un
plano que pasa por el origen; ambos son subespacios de R3. Nada de lo anterior es
fortuito; es una consecuencia del siguiente resultado general.
Teorema 8.2.1. Si T:V -i. W es una transformación lineal, entonces:
a) El núcleo de T es un subespacio de V.
b) El recorrido de T es un subespacio de W.
Demostración de a).Para demostrar que ker(7) es un subespacio se debe probar
que contiene por lo menosa un vector y es cerrado bajo la adición y la
multiplicación escalar. Por el inciso a) del teorema 8.1.1, el vector O está en
ker(7'), de modo que este conjunto contiene por lo menos un vector. Sean v, y v2
vectores en ker(7') y sea k cualquier escalar. Entonces
T(v,
+ v2) = T(v,) + T(v2) = O + O = O
de modo que v1 + v2 está en ker(7). También,
T(kv,) = kT(v,) = M) = O
de modo que
kv, está en ker(T).
Demostración de 6). Como T(0) = O, existe por lo menos un vector en R(7). Sean
w, y w2 vectores en el recorrido de T y k cualquier escalar. Para demostrar esta
parte es necesario probar que w, + w2 y
están en el recorrido de T; es decir, se
deben encontrar vectores a y b en Vtales que T(a) = w, + w2 y T(b) = k w , .
Como w, y w2 están en el recomdo de T, en V existen vectores al y tales
que T(al) = w, y T(%) = w2. Sean a = a, + % y b = ka,. Entonces
kw,
Y
T(b) = T ( k a , )= kT(a,) = kw,
con lo cual se completa la demostración. 0
RANGO Y
NULIDAD DE LAS
TRANSFORMACIONES
LINEALES
En la sección 5.6, el rango de una matriz se definiócomo la dimensiónde su espacio
columna (o renglón) y la nuhdad como la dunensión de su espacio nulo. La siguiente
definiciónextiende estas definicionesatransformaciones lineales generales.
Definición. Si T:V -i. W es una transformación lineal, entonces la dimensión del
recorrido de T se llama rango de T y se denota por rango (7'); la dimensión
del núcleo se denomina nulidad de T y se denota por nulidad (7).
464
1
Transjormaciones lineales
Si A es una matriz m x n y TA:R" Rm es la multiplicación por A, entonces
por el ejemplo 1 se sabe que ker(T) de 7> es el espacio nulo. deA y que el recorrido de
es el espacio columna de A . Por tanto, se tiene la siguiente relación entre
cl rango y la nulidad de una matriz y el rango y la nulidad de la transformación
matricial correspondiente.
-+
7'
Teorema 8.2.2. Si A es una matriz m
por A , entonces:
X
n y TA :R"
+
Rm es la multiplicación
a ) Nulidad ( T A )= Nulidad (A)
b ) Rango ( 7 ' ~ =Rango
)
(A).
Ejemplo 7 Sea T4:R6+ R4 la multiplicación por
A = [
-
1
3
2
4
2
-7
-5
-9
0
2
2
2
4
5
o
4
-4
-
1
6
-
4
Encontrar el rango y l a nulidad de TA
En elejemplo 1 de la sección 5.6 sedemostró que rango ( A ) = 2 y
nulidad (A) = 4. Así, por el teorema 8.2.2 se tiene rango ( T A )= 2 y nulidad (A) =
4. A
Solución.
Ejemplo 8 Sea T:R3 + R3 la proyección ortogonal sobreel plano xy. Por el
ejemplo 4, el núcleo de T es el eje z, que es unidimensional, y el recorrido de T es
el plano xy, que es bidimensional. Por lo tanto,
nulidad ( T ) = 1 y rango ( 7 ) = 2 A
TEOREMA DE
LA DIMENSIóN
DE LAS
TRANSFORMACIONES
LINEALES
Recuérdesepor el teoremade la dimensión para matrices (teorema 5.6.3) que si A
es una matriz con n columnas, entonces
rango (A) + nulidad ( A ) = n
El siguiente teorema, cuya demostración sepospone hasta el final de la sección,
extiende este resultado a transformaciones lineales generales.
Teorema 8.2.3. (Teorema de la dimensidn para transformaciones lineales). Si
T:c' W es una transforrnación lineal de un espacio vectorial V de dimensión
n a un espacio vectorial W, entonces
-+
rango(T) + nulidad(T) = n
8.2 Núcleo y recorrido / 465
Expresado en palabras, este teorema establece que para transformaciones lineales
la suma del rango y la nulidad es igual a la dimensión del dominio.
OBSERVACI~N. Si A es una matriz m X n y TA:Rn+ R"' es la multiplicación por
A, entonces el dominio de TA es de dimensión n, demodo que en este caso el
teorema 8.2.3 concuerda con el teorema 5.6.3.
Ejemplo 9 Sea T:R2 + R2 el operador lined que hace girar a cada vectordel
plano xy por un ángulo 8. En el ejemplo 5 se demostró que ker(7) = { O } y que
R(T) = R 2 . Así,
rango ( r ) + nulidad ( T ) = O + 2 = 2
lo cual concuerda con el hecho de que el dominio de T es bidimensional. A
DEMOSTRACIóN ADICIONAL
Demostración del teorema 8.2.3. Se debe demostrar que
dim(R(T))
+ dim(ker(T)) = n
La demostración se proporcionará para el caso en que 1 Idim(ker(7)) < n. Los
casos dim(ker(2)) = O y dim(ker(7)) = n se dejan como ejercicios. Supóngase que
dim(ker(7)) = r, y sea v l , . . . , v, una base para el núcleo. Como {vl, . . . , v,) es
linealmente independiente, el teorema 5.4.66 establece que existen n - r vectores,
v,+~,. . . ,vn, tales que {vl, . . . , v,, v , + ~ ., . . , v,} es unabase de V. Para completarla
demostración, se probará que los n - Y vectores en el conjunto S = { T(V,+~),. . . ,
T(v,)} forman una base para el recorrido de T.Entonces se concluirá que
dim(R(T)) + dim(ker(T)) = ( n - r )
+r =n
Primero se demostrará queS genera el recorrido de7'. Si b es cualquier vectoren
el recorrido de T.entonces b = T(v) para algún vector v en V. Como { v , , . . . , v,,
v , + ~ ., . . , vn} es una base para V, entonces el vector v se puede escribir como
v = ClV1
+ . . + c,v, + c,+ 1v,+ 1 + . . . + c,v,
'
En virtud de que v l , . . . , v, están en el núcleo de T, se tiene T(v1) =
O, de modo que
..=
T(v,)
=
b = T(v) = c,+ ,T(v,+ ,) + . . . + c,T(v,)
Así, S genera el recorrido de T
Por último, se demostrará que S es un conjunto linealmente independiente y
que, en consecuencia, forma una base para el recorrido de T. Supóngase que alguna combinación lineal de los vectores en S es cero; es decir,
466
i
Transformaciones lineales
k,,
, T(v,+
+ . . . + k,T(V,)
1)
Se debe demostrar que kr+, = . . . = k,
de nuevo como
T(k,.+ ,v,+ I
=
=
o
(2)
O . Como T es lineal, (2) se puede escribir
+ . . . + k,v,)
=O
lo cual establece que k,+lvr+l +
. + k,v, está en el núcleo de T. Por consiguiente, este vector se puede escribir como una combinación lineal de los
vectores básicos (vl.. . . , v,.}, por ejemplo,
'
k,
+
Iv,
+ . . . + k,v,
= k,v,
+ . . . + k,~,
Así,
k,vl+ . . . + k,v,
-
k , , 1~,,
I - . . . - k,v, = O
Como {vl, .
, v,} es linealmente independiente, todas las k son cero; en
particular, krtl= . . = k, = O, con lo que se completa la demostración. 0
'
EJERCICIOS DE LA SECCIÓN 8.2
1. Sea T:R2+ H 2 el operador lineal defiuido por la expresión
i,Cuáles de los siguientes vectores están en K( T)?
a) (1, -4).
b) ( 5 , O ) .
c) (-3, 12).
2. Sea TI??+ R' el operador lineal del ejercicio 1. 2,Cuáles de los siguientes vectores
están en ker( T)?
a) (5, 10).
b) ( 3 , 2 ) . c) (1, 1).
3. Sea T@
+ K3
l a transfonnación lineal definida por l a expresión
¿Cuáles de los siguientes vectores están en K( T)?
a) (0,0,6).
b) ( I , 3,O).
c ) (2,4, 1).
4. Sea TJr'
+ R3 la transformación lineal del ejercicio 3. (,Cuáles de los siguientes vcctores están enker(T)?
a) ( 3 , -8,2, O).
b) ( O , O, O, 1).
C) (O, -4, 1, O).
5. Sea T:P, + P, la transformación lineal definida por T(p(x)) = xp(x). ¿Cuáles de los
siguientes vectores están en ker(T)?
a) x3.
b) O.
c) 1 +x.
8.2 Núcleo y recorrido / 467
6. Sea TF, + P, la transformación lineal delejercicio
vectores están en R( o?
a) x + x ?
b) 1 + x .
c) 3 -2.
5. ¿Cuáles de los siguientes
7. Encontrar una base para el núcleo
a) del operador lineal del ejercicio l.
b) de la transformación lineal del ejercicio 3.
c) de la transformación lineal del ejercicio 5.
8. Encontrar una base para el recorrido
b) de latransformación lineal del ejercicio 3.
a) del operador lineal el ejercicio 1.
c) de la transformación lineal del ejercicio 5.
9. Comprobar la fórmula (1) del teorema de la dimensión para
b) latransformaciónlinealdel
a) el operador lineal del ejercicio 1.
c) la transformación lineal del ejercicio 5.
ejercicio 3.
En los ejercicios del 10 al 13, sea T la multiplicación por la matnz A . Encontrar
a) una base para el recorrido de T. b) una base para el núcleo de T.
c) 1 rango y la nulidad de T.
d) el rango y la nulidad de A .
[i -i]
-1
10. A =
1:
2
11. A =
0
1
3
-1
2
-a]
-
4
-2
0
3
5
!
-1
5
0
o
o
1
9
-1
-1
8
14. Describir el recorrido y el espacio nulo de la proyección ortogonal sobre
a) el plano xz.
b) el plano yz.
c) el plano cuya ecuación es y = x.
15. Sea V cualquier espacio vectorial y sea T:V + V definida por T(v) = 3v.
a) ¿Cuál es el núcleo de T?
b) ¿Cuál es el recorrido de 77
16. En cada inciso, usando la información proporcionada para obtener la nulidadde T.
a) T A +
~ R? tiene rango 3.
b) TP4 + P, tiene rango 1.
c) El recorrido de TR' -D R3 es R3. d) TMZ2+ M,, tiene rango 3.
X 6 tal que A x = O sólo tiene la solución trivial, y sea TR'
multiplicación por A . Encontrar el rango y la nulidad de A .
17. Sea A una matriz 7
18. Sea A una matriz 5
+ R7 la
X 7 con rango 4.
a) ¿Cuál es la dimensión del espacio solución de Ax = O?
b) ¿Es consistente A x = b para todos los vectores b en R'? Explicar la respuesta
89. Sen 1'8'
I.'u11u transformación lineal de R' a cualquier espacio vectorial. Demostrar
que el nrhcleo de T es una I-eecta que pasa por el origen, un plano que pasa por el origen,
S 6 1 0 el or'lgen o todo R3
20. Sen 7'. I.; -3. R 3 una transformación l~nealde crlalquicr espac~ovcctorial a R 3 . Demostrar
quc el recomdo dc 1" es una recta qrx pasa por el origen, un plano que pasa por el
arrgen, sólo e¡ orlgen o todo I?
21. sea T:R'
+
Hi la multlpiicacion por
a) Ikmostrar que el nilcleo de 7' es una recta que pasa por el origen y encontrar
ecuacrollcs paramétncas de Csta.
b) Ikmostrar que elrecorrido de T es un plano que pasa por el origen y encontrar una
ecuación de Cste.
22. Demostrar: Si f v , . v 2 , . . , v n ) es una base para V y w , , w2, . . . , w nson vectores en
I+', no necesariamente distintos, entonces existe una transfommción lineal T:l' + W tal
que 7'(vlj = w,,T(v7) = w:, . . . , T(v,) = wn.
23. Lknostrar el teorema de la dimensión en los casos en que
b) dim(ker(7')) = n.
a) dim(ker(T)) = O
21. Sea 7'1.'
-3. I" u 1 1 operadorlineal
sobre un espacio vectorial V de dimensión finita.
Ilemostrar que H ( T ) = s i y sólo SI keI(7') = {O}
I.'
25. (Para quienes ya estudiaron Cálculo). Sea DFp,-3. P2 l a transformación derivación
I)( p) = p'(x).Describir el núcleo de 13.
26. (Para quienes ya estudiaron Cálculo). Sea J:P,
.I@) = p ( x ) dx. Describir el núcleo de J.
+
R l a transformación integraci6n
27. (Pura quienes y a estudiaron Cálculo). Sea D:V -., W la transformación derivación
[I( p) =,f(x). donde I' = C2( - 00,m ) v W = F( - 00,m). Describir el núcleode D o D.
8.3 TRANSFORMACIONES LINEALES INVERSAS
En la seccibn 4.3 se analizaron las propiedades de las transformaciones lineales
uno a uno de R" a R". En esta sección se extenderán tales ideas a transformaciones lineales generales.
TRANSFORMACIONES LLNEALES UNO A UNO
Recuérdese de la sección 4.3 que una transformación lineal de R" a R" se denomina uno a uno o biunivoca si mapea vectores distintos de R" en vectores distintos de R"'. La siguiente definición generaliza esta idea.
8.3 Transformaciones lineales inversas
I'
469
~~
Definición. Una transformación lineal T:V + W se llama uno a uno si 7 mapea vectores distintos de Ven vectores distintos de W.
Ejemplo 1 Recuérdese por el teorema 4.3.1 que si A es una matriz n X n y
TA :Rn + R" es la muitiplicación por A , entonces T> es uno a uno si y sólo si A es
una matriz invertible. A
Ejemplo 2 Sea T:Pn + Pn+l la transformación lineal
T(p1 = T ( p ( x ) )= x p ( x )
analizada en el ejemplo S de la sección S. l . Si
p = p ( x ) = Cg + c,x +
' '
.
+ c,xn
y
= y(x) = do
+ d , +~. . . + d,,x"
son polinonlios distintos, entonces difieren en por lo menos un coeficiente. Así,
también difieren en por lo menos un coeficiente. Por tanto, T es uno a uno, ya que
mapea polinomios distintos p y q en polinomios distintos T(p) y T(q). A
Ejemplo 3 (Para quienes y a estudiaron Cálculo). Sea
la transformación derivación analizada en el ejemplo 11 de la sección S. l . Esta
transformación lineal no es uno a uno, ya que mapea en la mismafunción a
funciones que dlfieren por una constante. Por ejemplo.
D ( x 2 )= D(x2
+ 1) = 2x
A
El siguiente teorema establece una relación entre una transformación lineal
uno a uno y su núcleo.
Teorema 8.3.1. Si T:l/ + W es una transformación lineal, entonceslas siguientes proposiciones son equivalentes.
a ) T es uno a uno.
b ) El núcleo de T sólo contiene al vector cero; esdecir. ker(7) = { O } .
c) Nulidad ( r ) = O .
"
.l.-_"."
Denzostrraclhn. Se deja como ejercicm ficil demostrar la equivalcncia de h ) y c);
l a dzmostración se completará probando !a equi:.alcncia di:0) v h).
4 70 i Transformaciones lineales
a =$ 6: Supóngase que T es uno a uno, y sea v cualquier vector en ker(7). Como v y
O , están en ker(7), se tiene T(v)= O y T(0) = O. Pero esto indica que v = O , ya que T
es uno a uno; asi, ker(7) sólo contiene al vector cero.
b
* a: Supóngase que ker(7) = O y que v y w son vectores distintos en
V"
es decir.
(1)
w#O
Para demostrar que T esuno a uno es necesario probar que T(v) y T(w) son
vectores dstintos. Pero si este no fuese el caso, entonces se tendría
T(v) = T(w)
T(v)- T(w) = o
T(v - w) = o
lo cual indica que v - w está en el núcleo de T. Como ker(T) = O , se tiene que
v-w=o
lo cual contradice (1). Así, T(v)y T(w) deben ser hstintos. 0
Ejemplo 4 En cada inciso, determinar si la transformación lineal es uno a uno,
encontrando el núcleo o la nulidad y aplicando el teorema 8.3.l .
a) T:R2 + R2 hace girar a cada vector por un ángulo 8.
b) T:R3 + R3 es la proyección ortogonal sobre el plano xy.
c) T:R6 .+ R4 es la multiplicación por la matriz
7
2
0
2 - 5
2
4
4 -9
2 -4
1
6
-4
1
7
Solución de u). Del ejemplo 5 de la sección 8.2, ker(7")= { O ) , así que T es uno a
uno.
Solución de b). Del ejemplo 4 de la sección 8.2, ker(7') contiene vectores
diferentes de cero, de modo que T no es uno a uno.
Solución de c). Del ejemplo 7 de la sección 8.2, nulidad (7')
uno a uno. A
=
4, así que T no es
8.3 Transformaciones lineales inversas / 471
En el caso especial en que T es un operador lineal sobre un espacio vectorial
de dimensiónjnita, entonces se puede agregar otra proposición al teorema 8.3.1.
Teorema 8.3.2. Si V es un espacio vectorial de dimensión finita, Y 1':v I/ es
un operador lineal, entonces lassiguientes proposiciones son equivalentes.
-+
a ) T es uno a uno.
b ) ker(T) = ( O } .
c) Nulidad (7') = O.
d) El recorrido de T es V; es decir, R(T) = V.
Demostración. Sesabe que a), b ) y c ) son equivalentes, de modoquela
demostración se puede completar probando la equivalencia de c ) y d).
c * d. Supóngase que dim@') = n y que nulidad (7') = O. Por el teorema de la
dimensión (teorema 8.2.3) se concluyeque
rango(7') = n - nulidad (7') = n
Por definición, rango(T) es la dimensión del recorrido de T. así que el recorrido de
T tiene dimensión n . Ahora, por el teorema 5.4.7 se concluye que el recorrido de 1'
es V, ya que los dos espacios tienen la misma dimensión.
* c. Supóngase que dim(V) = n y que R(T) = V. Por estas relaciones se concluye
que dim(R(T)) = n, o bien, de manera equivalente, que rango (7') = n. entonces, por
el teorema de la dimensión (teorema 8.2.3) se concluyeque
d
nulidad ( r )
=n
- rango(T) = n
ji
-- n = O.
-,
Ejemplo 5 Sea TA:R4+ R4 la multiplicación por
1
3
-2
-4
1
1
4
Determinar si TA es uno a uno.
Solución. Como se hizo notar en el ejemplo 1, el problema dado es equivalente a
determinar si A es invertible. Pero det(A) = O, ya que los dos primeros renglones
de A son proporcionales y, en consecuencia,A no es invertible. Por tanto, TA no es
uno auno. A
TRANSFORMACIONES
LINEALES
INVERSAS
Enla sección 4.3 sedefinió la inversa deun operadormatricial uno a uno
TA:R" R" comoel operador matricial TA-1:Rn"* R", y se demostró que si w es la
imagen de un vector x bajo TA, entonces TA-I mapea w de regreso en x. A
continuación, estas ideas se extenderán a transformaciones lineales generales.
+.
472
i
Transformaciones lineales
Recuérdese que si T:V "* W es una transformación lineal, entonces el
recorrido de T, denotado por R(T), es el subespacio de W que consta de todas las
imágenes bajo T de los vectores en V. Si T es uno a uno, entonces cada vector v en
V tiene una imagen ÚnIca w = T(v) en R ( 0 . Esta unicidad del vector imagen
permite definir una nueva función, denominada inversa de T, denotada por T- l .
que mapea w de regreso en v (figura 1).
Se puede demostrar (ejercicio 19) que T- : R(T) + V es una transformación
lineal. Además, por la definición de T" se concluye que
T - '(T(v)) = i" '(w) = v
de modo que T y T u l , cuando se aplican consecutivamente en cualquier orden,
cancelan entre sí el efecto que tienen.
Es importante notar que si T:V + W es una transformación lineal
uno a uno, entonces el dominio de T- es el recorrido de T. Éste puede ser o no
todo W. Sin embargo, en el caso especial en que T:V "* Ves un operador lineal uno
a uno, por el teorema 8.3.2 se concluye que R(T) = V. es decir, el dominio de Tes todo V.
OBSERVACI~N.
Ejemplo 6 en el ejemplo 2 se demostró que la transformación lineal T:Pn -+ P,+l
definida por
n P) = T(P(.Y)) =
es uno a uno; así, T tiene inversa. Aquí, el recorrido de T no es todo P,,,; en vez
de ello, R(7) es el subespacio de P,+, que consta de los polinomios con término
constante cero. Este hecho es evidente a partir de la fórmula para T:
T(C,
+ C'X + . . . + C , Y )
= cox
+ c,x2 + . . . + C,X"+
Se concluyeque T- ' : R ( q -c Pn está definida por la fórmula
T - '(cox + c,x2 + .
' '
+ c,x"
+
1)
= c*
+ c1x + . . . + c&?
Por ejemplo, en elcaso en que n = 4,
T-l(2x - x2
+ 5x3 + 3x4) = 2 - + 5x2 + 3x3
X
A
8.3 Transformaciones lineales inversas / 473
Ejemplo 7 Sea T:R3 + R3 el operador lineal definido por la fórmula
T(X1, X2, X3) = (3x1
+
X2,
"2x1 - 4x2
+ 3x3,
5x1
+ 4x2 - 2x3)
Determinar si T es uno a uno; en caso afirmativo, encontrar T- '(x,, x2, x3).
Solución. Por el teorema 4.3.3, la matriz estándar para T es
3
[TI=
-2
1
0
-4
(comprobar). Esta matriz es invertible y por la fórmula (1) de la sección 4.3, la
matriz estándar para T" es
4
-2
-3
[T"]=[T]-'=
-12
7
10
Se concluye que
Expresando este resultado en notación horizontal se obtiene
INVERSASDE
COMPOSICIONES
El siguiente teorema muestra que la composición de transformaciones lineales uno
a uno es uno a uno, y relaciona la inversa de la composición con las inversas de
las transformaciones lineales individuales.
Teorema 8.3.3. Si T , : U
+
V y T2:V + W son transformaciones lineales uno a
uno, entonces:
a)
T, TIes uno a uno.
0
h) (T2 0 Tl)-I =
r;'
0
Ti-].
Demostración de a). Se quiere demostrar que T2 o T, transforma vectores distintos
de U en vectores distintos de W. Pero si u y v son vectores distintos de U, entonces
T I @ )y Tl(v)son vectores distintos de V ya que T , es uno a uno. Lo anterior y el
hecho de que T2es uno a uno indican que
474 1 Transformaciones lineales
Y
T,(TI(U))
T,(T,(V))
también son vectores distintos. Pero estas expresiones también se pueden escribir
como
de modo que T2 T, transforma u y v en vectores distintos de W.
Demostración de (6).
Quiere demostrarse que
(T,~T,)~'(w)=(T,~~T,')(w)
para todo vector w en el recomdo de T, T I .Para este propósito, sea
o
de modo que la meta es demostrar que
u =(T,
'
0
T,- l)(w)
Pero por ( 3 ) se concluye que
(T, 0 T,)(uj = w
o bien, de manera equivalente,
T,(T,(u)) = w
Ahora, aplicando 2";'a cada miembro de esta ecuación y luego
bro del resultado, se obtiene (comprobar)
T;'a cada miem-
o bien, de manera equivalente,
En otras palabras, el inciso b) del teorema 8.3.3 establece que la inversa de
una composición es la composición de las inversas en orden invertido. Este resultado se puede extender a composiciones de tres o más transformaciones lineales; por ejemplo,
En el caso especial en que TA, TB,y Tc, sean operadores matriciales sobre R", entonces la fórmula (4) se puede escribir como
8.3 Transformacioneslineales inversas / 475
o bien, de manera equivalente,
En palabras, esta fórmula establece que la matriz estándar para la inversa de una
composición es el producto de las inversas de las matrices estándar de los operadores individuales en orden invertido.
En los ejercicios se proporcionan algunos problemas en los que se usan las
fórmulas (4) y (S).
EJERCICIOS DE LA SECCIÓN 8.3
1. En cada inciso, encontrar ker(Z') y determinar si la transformación lineal T es uno a
Uno.
a) T :R2+ R2, donde T(x, y ) = ( y , x)
b) T :R2+R2, donde T(x, y ) = (O, 2x + 3y)
c) T : R 2 + R 2 , donde T(x, y) = (x + y , X - y )
d) T :R2 +R 3 , donde T(x,y ) = (x, y, x + y )
e) T :R2+ R', donde T(x, y ) = (x - y, y - x, 2x - 2y)
f) 2': R 3 +R 2 , donde T(x,y, z) = (x + y + z, x - y - z)
2. En cada inciso, sea T.&2 -* R2 la multiplicación por A . Determinar si T tiene inversa;
en caso afirmativo, hallar
3. En cada inciso, sea
TX3+ R3 la multiplicación por A . Determinar si T tiene inversa;
en caso afirmativo, encontrar
1
4 1 5 2
a ) A = [ - 1 1 21 ol ]
" A = [ - ;
;
i]
1
0
1
c ) A = [ O1 11 0I]
.)A=[:
4. En cada inciso, determinar si la multiplicación por A es una transformación lineal uno
a uno.
-:]
476 / Transformaciones lineales
1
1
-7
3
5
2
-
1
3
0
'1
c) A
=
0
S. Sea 1'8'
-+ R~ la proyección ortogonalsobre la rectay = x (figura 2).
a) Encontrar el núcleo de T.
b) ¿,Es Tuno a uno? Justificar la conclusión.
Figura 2
6. Sea FA2 + R2 el operador lineal T(x,y) = ("x, y ) que refleja cada punto con respecto
al eje y (figura 3).
a) Encontrar el núcleo de T.
h) ¿Es T u n o a uno? Justificar la conclusión.
ry
I
Figura 3
7. En cada inciso, usando la información dada determinar si T es uno a uno.
b) TBn + R"; rango ( T ) = n - 1
a) T:Rm + R"; nulidad(T) = O.
c) TRm -+ R"; n < m .
d) TBn + Rn; R( T)= R".
8. En cada inciso determinar si la transformación lineal T es uno a uno.
a) 7 :P2+P,, donde T(u,+ a , x + u 2 x 2 )= x(ao + a,x+ a$)
b) T : P2-+P2, donde T ( p ( x ) )= p ( x 1)
+
9. Sea A una matriz cuadrada tal que det(A) = 0 LLa multiplicación por A es una
transformación lineal? Justificar la conclusión.
10. En cadainciso determinar si eloperador lineal T X n
afirmativo, encontrar ~ " ( x , ,xz, . . . ,x,,).
7 '(XI, x2, . . . , x n ) .
a) T ( . x , , x 2, . . . , .x , j ) = ( 0 , ~ l , ~. 2. .r, x = - , )
c) í"(x,, x*,. . . , x,,) = (x2, x3, . . . x,, XI )
-+
Rn es uno a uno;encaso
~
b) T(x,,xL,. . . , x , ) = j x , , ~ . , ~ ,I . . . , . x ? , x i )
1
11. Sea TAn + Rn el operador lineal definido por la fórmula
qx,,
x*, . . . , x , )
= (a,x1,a,x,,
. . . , a,,x,)
a) ¿En qué condiciones T tiene inversa?
8.3 Transformacioneslineales inversas / 477
b) Suponiendo que se cumplen las condiciones determinadas en el inciso a), encontrar
una fórmula para T"(xl, x2, . , xn).
12. Sean Tl:R2+ R2 y T2@ + R2 los operadores lineales definidos por las fórmulas
T , ( x ,y ) = (x + y, x'
"
T,(x, y ) = (2x + y. x
y
y)
-
2y)
a) Demostrar que T I y Tz son uno a uno.
T," (x,y ) , T;' (x,y ) y (Tz TI)-' (x, y )
b) Encontrar fórmulas para
0
c) Comprobar que ( T 20
13. Sean T;P, + P , y Tz:P, +
= T I p 10
P, las transformaciones lineales definidas por las fórmulas
a) Encontrar fórmulas para
q-' @(x)), í?;I
b) Comprobar que (T2 0 T I ) - ¡=
14. Sean
T2-l.
0
@(x)) y
(T2 O T 1 ) - ' @ ( x ) )
T2-I
TAR^ + R3, T g R 3 + R3 y T p R 3 + R3 las reflexiones con respecto al plano x y , al
plano xz y al plano yz, respectivamente. Comprobar la fórmula (5) para estos operadores lineales.
15. Sea TPl + R2 la función definida por la fórmula
T M x ) ) = (P(O),
P( I )I
a)
b)
c)
d)
Encontrar T( 1 - 2x).
Demostrar que T es una transformación lineal.
Demostrar que T es uno a uno.
Encontrar T"(2,3) y trazar su gráfica.
16. Demostrar: Si V y W son espacios vectoriales de dimensiones finitas tales que dim W <
dim V, entonces no existe ninguna transformación lineal uno a uno T:V + W.
17. En cada inciso, determinar si el operador lineal TMZ2+ MZ2es uno a uno. En caso
afirmativo, encontrar
T(x, y ) =
Demostrar que T es uno a uno para todo valor real de k y que T" = T.
18. Sea TR2 + R2 el operador lineal defindo porlafórmula
(x
+ /y, -y)
19. Demostrar que si T:V + Wes una transformación lineal uno a uno, entonces T":R(T)
+
Ves una transformación lineal.
20. (Para quienes ya estudiaron CruCulo). Sea JPI + R la transformación integración
1
J(p) = j-, p(x)dx. Determinar si J es uno a uno. Justificar la ccnclusión.
478
,,
Transformaciones lineales
8.4 MATRICES DE TRANSFORMACIONES LINEALES GENERALES
En esta sección se demostrará que si V y W son espacios vectoriales de dimensiones3nitas (nonecesariamente R" y Rm),entonces con un poco de ingenio cualquier transformación lineal T:V -+ W .se puede considerar corno una tran$ormación matricial. La idea básica es trabajar con las matrices de coordenadas de los
vectores, en vez de hacerlo con los vectores mismos.
MATRICES DE
TRANSFORMACIONES
LINEALES
Supóngase que V es un espacio vectorial n dimensional y que W es un espacio
vectorial m dimensional. Si se eligen bases B y B' para V y W,respectivamente,
entonces para todo x en V la matriz coordenadas [xIB es un vector en R" y la
matriz coordenadas [ T ( x ) ] pes un vector en Rm (figura 1).
A es un
vector en V
(n-dimensional)
Figura 1
un A es
en
vector
T
X
I
I
i
un A es
en vector
W
(m-dimensional)
A es un
[x18
R"
T(x)
[ Tt4h
vector
en
R~
Si, como se ilustra en la figura 2, se completa el rectángulo sugerido en la figura 1,
se obtiene una aplicación de R" a Rm, que se puede demostrar es una transformación lineal. Si se deja que A sea la matriz estándar de esta transformación, entonces
La matnz A en (1) se denomina matriz para T con respecto a las bases B y B'.
T mapea
Ven W
X
I
T
T(x)
I
i
t
Figura 2
i
La multiplicación
por A mapea
R" en R"
8.4 Matrices de transformaciones lineales generales / 479
Después, en esta sección se darán algunos usos de la matriz A en (l),
pero primero se mostrará cómo se puede calcular. Para este efecto, supóngase
que B = {u1, u2, . . . , U,,} es una base para el espacio n dimensional V, y que
B' = {vl, v2, . . . , vm} es una base para el espacio m dimensional W . Se trata
de encontrar una matriz m X n
A=
que (1) se cumpla para todos los vectores x en V. En particular, se quiere que
esta ecuación sea verdadera para los vectores básicos ul, u*,. . . , U,,; es decir,
tal
A[uI]B=[T(ul)]B'~
A[u21B=[T(u2)1Br,
...)
A[unlB=[T(un)lBr
Pero
O'
1
O
de modo que
I '
'
] =
O
a11
a12
a2 1
a12
am2
(2)
380
"
Transformaciones lineales
Sustituyendo estos resultados en (2) se obtiene
lo cual demuestra que las columnas consecutivas de A son las matrices de
coordenadas de
con respecto ala base B'. Así, la matriz para T con respecto a las bases B y B' es
Esta matriz por lo común se denota con el símbolo
[
IR', B
de modo que la expresión precedente también se puede escribir como
y por (1) esta matriz tiene la propiedad
Nótese que en la notación [qF8el subíndice derecho es una
base para el dominio de T y que el subíndice izqulerdo es una base para el espacio
imagen de T (figura 3 ) .
OBSERVACI~N.
, E
44
Además, obsérvese cómo el subíndice B parece "cancelarse" en la fórmula (4a)
(figura 4).
8.4 Matrices de transformaciones lineales generales / 481
MATRICES DE
OPERADORES
LINEALES
En el caso especial donde V = W (de modo que T:V + V es un operador lineal), es
común tomar B = B' al construir una matriz para T. En este caso la matriz resultante se denomina matriz para T con respecto a labase B y se denota por [ q ~en,
vez de [ ~ BB.I Si B = {u1, u,, . . . u,}, entonces en este caso las fórmulas (4) y
(4a) se convierten en
Y
En términos informales, las expresiones (4a) y (5a) establecen que la matriz para
T multiplicada por la matriz de coordenadas para x es la matriz de coordenadas
para í"(x).
Ejemplo 1 Sea T:P, * P, la transformación lineal definida por
Encontrar la matriz para T con respecto a las bases estándar
u, = 1,
u* =x; v1
=
1,
v2
=x,
v3 = x 2
Solución. A partir de la fórmula dada para T se obtiene
T(u,)= T(1) = (x)jl) = x
T(U2) =
T(x) = (x)(x) = x2
Por inspección es posible determinar las matrices de coordenadas para T(u,) y
T(u,) con respecto aB'; éstas son
482
'
Transformaciones lineales
Ejemplo 2 Sea T:P, -+ P, la transformación lineal del ejemplo 1. Demostrar que
la matriz
[a y]
o 0
1 TI,..,=
(obtenida en el ejemplo 1) satisface (4a) para todo vector x
Solución.
=a
+ bx en P ,
Como x = p (x) = a + bx, se tiene
T(x)= xp(x)
= ax
+ hx2
Para las bases B y B' del ejemplo I, por inspección se concluyeque
[ T(x)],.= [ax
Por tanto,
+ bx2] =
[:I
a
de modo que (4a) se cumple. A
Ejemplo 3 Sea T:R2+ R3 la transformación lineal definida por
8.4 Matrices de transformaciones lineales generales / 483
Encontrar la matriz para la transformación T con respecto alas bases B = { ul,u2}
para R2 y B' = {vl, v2, v3}para R3, donde
Solución. A partir de la fórmula para T,
Expresando estos vectores como combinaciones lineales de vl, v2 y v3 se obtiene
(comprobar)
T(u,) = v 1 - 2v3,
T(u2)
= 3v,
+ v2
Así,
de modo que
Ejemplo 4 Sea T R 2 + R2 el operador lineal definido por
T(
[;;I)
=
[
-
+
"1
2x, + 4x2
y sea B = {ul, u2} la base, donde
a) Encontrar [ q ~ .
b) Comprobar que (5a) se cumple para todo vector x en R2
Solución de a ) . Por la fórmula dada para T,
-
v3
484
Transformaciones
lineales
Por consiguiente,
En consecuencia,
Solución de b).
Si
x=
[:;I
es cualquier vector en R2, entonces por la fórmula dada para T
=
[
x1
-2x1
+ x2
+ 4x2]
Para encontrar [xIB y [T(x)IB,es necesario expresar (6) y (7) como combinaciones
lineales de u1 y u2.Esto conduce a las ecuaciones vectoriales
Igualando los elementos correspondientes se obtienen los sistemas lineales
+ k , = x,
k , + 2 k , = x2
k,
Y
+ c2 = x, +
c , + 2c, = -2x, + 4x2
c1
x2
Resolviendo (10) para k , y k, se obtiene
k , = 2 x 1 -x2,
de modo que
rx1B =
k2=
[
-X,
2x, - x2
-x1 +x2]
+X,
8.4 Matrices de transformaciones lineales generales i 485
y resolviendo (1 1) para c1 y c2 se obtiene
CI
= 4 X l - 2x2,
C2
= -3Xl
+ 3x2
de modo que
Así,
de modo que (5a) se cumple. A
MATRICES DE
OPERADORES
IDENTIDAD
Ejemplo 5 B = {u1,u2, . . . , U,,} es cualquier base para un espacio vectorial V de
dimensión finita e I:V * Ves el operador identidad sobre V, entonces
I ( U , ) = UI, I(u2)= u2, . .
. , I(un)= u,
Por consiguiente,
Así,
...
...
'..
... 1
En consecuencia, la matriz de operador identidad con respecto a cualquier base es
la matriz identidad de n X n. Este resultado se pudo haber anticipado a partir de la
fórmula (5a), ya que la fórmula produce
[zlB[xlE =
E])'('[
= ['IR
lo cual es consistente con el hecho de que [Ijs= I. A
Se deja como ejercicio demostrar el siguiente resultado
186
1
Transformaciones lineales
Teorema 8.4.1. Si TR" + Rm es una transformación lineal y si B y 8'son las
bases estándar para R" y R", respectivamente, entonces
[TI,,,. = [ T I
(12)
Este teorema, establece que en el caso especial en que T transforma R" en Rm,la
matriz para T con respecto a las bases estándar es la matriz estándar para T. En
este caso especial la fórmula (4a) de esta sección se reduce a
[ T ] x = T(x)
POR QUÉ SON
IMPORTANTES
LAS MATRICES
DE LAS
TRANSFORMACIONES
LINEALES
Haydos razones esenciales para estudiar matrices de transformaciones lineales
generales, una teórica y otra bastante práctica:
A menudo es posible contestar preguntas teóricas acerca de
la
o
estructura de
transformaciones lineales generales sobre espacios vectoriales de dimensión
finita estudiando simplemente las transformaciones lineales. estas cuestiones
se consideran con más detalle en cursos más avanzados de álgebra lineal.
aunque se abordarán en secciones ulteriores de este texto.
Estas matrices hacen posible calcular imágenes de vectores usando multiplicación matricial. Los cálculos sepuedenefectuar rápidamente en computadora.
A fin de enfocar la segunda idea, sea T Y + W una transformación lineal.
Como se muestra en la figura 5, la matriz [TIFB se puede usar para calcular T(x)
en trespasos aplicando el siguiente procedimiento indirecto:
1) Calcular la matriz coordenadas [x]~.
2) Multiplicar xB por la izquierda por
para obtener [T(x)lBl.
3) Reconstruir T(x) a partir de su matriz coordenadas [T(x)]p.
[nBB
Ejemplo 6 Sea T:P, + P2 el operador lineal definido por
T ( p ( x ) )= P(3X - 5)
es decir, T(co + c I x + c2x2)= co + c1(3x- 5 ) + c2(3x -
8.4 Matrices de transformaciones lineales generales / 487
a) Encontrar T , con respecto ala base B = { 1, x, 2}.
b) Aplicando el procedimiento indirecto, calcular T( 1 + 2x + 3 2 ) .
c) Comprobar el resultado delinciso b) calculando directamente T(l + 2x +
3x2).
Solución de u). Por la fórmula para T.
T( 1)
=
T ( x ) = 3~ - 5,
1,
T ( x 2 )= ( 3 -~5)’
= 9x2 -
de modo que
3 0 +~ 25
[2 1
Por tanto.
Solución de 6).
2x + 3x2 es
La matriz de coordenadas con respecto a B para el vector p = 1 +
Así, por (5a)
a partir de lo cual se concluye que
+
T( 1 + 2~ + 3x2) = 66 - 8 4 ~ 27x2
Solución de c ) . Por cálculo directo
T(l
+ 2~ + 3x2) = 1 + 2 ( 3 -~ 5) + 3(3x 5)2
= 1 + 6~ - 10 + 27x2 - 9 0 +
~ 75
= 66
8 4+
~2 7 ~ ’
-
-
lo cual concuerda con el resultado del inciso b). A
488 / Transformaciones lineales
MATRICES DE
A continuación se enunciarán dos teoremas que son generalizaciones de la
COMPOSICIONES fórmula (21) de la sección 4.2 y de la fórmula (1) de la sección 4.3. Se omiten las
Y TRANSFORMA- demostraciones.
CIONES
INVERSAS
Teorema 8.4.2. Si T , :U + V y T,: V + W son transformaciones lineales y si B.
B" y B' son bases para U,V y W, respectivamente, entonces
[ T, T, I B ' J
O
=
[ T2 IB'.B"[ TI I
B 3
(13)
Teorema 8.4.3. Si T:V + V es un operador lineal y si B es una base para V,
entonces la siguientes proposiciones
son equivalentes.
a) T es uno a uno.
b) [qB
es invertible.
I Además, cuando estas condiciones equivalentes secumplen
I
OBSERVACI~N. En la expresión (13), nótese cómo el subíntllce interior B" (la
base para el espacio intermedo I? parece "cancelarse", quedando como Subindices
sólo las bases para el dominio y el espacio imagen de la composición (figura 6 ) .
Figura 6
Esta cancelación de Subindices interiores sugiere la siguiente extensión dela
fórmula (13) a composiciones de tres transformaciones lineales (figura 7).
El siguiente ejemplo ilustra el teorema 8.4.2.
Ejemplo 7 Sea T I P , + P, la transformación lineal definida por
TI(P(X))= .vP(x)
y sea T2:P2+ P , el operador lineal definido por
8.4 Matrices detransformaciones lineales generales I 489
(T, 0 TI)@, + CIX)
= (3x
-
= C0(3X
+ CI(3X - 5))
5) + Cl(3X - 5)*
5)(c,
-
(16)
En este ejemplo, P , desempeña el papel de U en el teorema 8.4.2 y P, desempeña
los dos papeles de V y W, por tanto, en (13) se puede tomar B' = B", de modo que
la fórmula se simplifica a
(17)
[ T, TI l B ' , B = [ T2 IB'[ TI IB',B
O
Se elegirán B = { 1, x} como la base para P , y B' = { 1. x, x,} como la base para P,.
En los ejemplos 1 y 6 se demostró que
Así, por (17) se concluye que
Como comprobación, [T, TilFB se calculará directamente a partir de la fórmula
(4). Como B = { 1, x}, por la fórmula (4) con u1 = 1 y u, = x se concluye que
Aplicando (16) se obtiene
(T, Tl)(l) = 3x - 5
0
y
[-a]
(T2 T,)(x)
=( 3 ~ 5),
0
= 9x2 - 3
Como B' = { 1, x, 2},
a partir de ésto se concluye que
w
2
0
T ~ ) ( =
~ N ~ ~
y
w
2
0
[
~ ~ ) ( x )=
1 ~,
0 +~ 25
490
Transformaciones
lineales
Sustituyendo en (19) se obtiene
[;
-5
7',1,,
=
25
-3;]
lo cual concuerda con (18). A
EJERCICIOS DE LA SECCIóN 8.4
1. Sea TP,+ P3 la transformación lineal d e f ~ d por
a T(p(x)) = xp(x).
a) Encontrar la matriz para T con respecto a las bases estándar
B = {U,, U*, ~
3
)
B' =
y
~ 2 vi.
,
vql
donde
UI= I,
u2 = x ,
v,
v2 =x,
=
1,
u3 = x >
vj = x 2 ,
v4 =x3
[uFB
b) Comprobar que la matnz
obtenida en el inciso a) satisface la fórmula (4a)
para todo vector x = c o + cIx + e$ en Pz.
2. Sea T:P, + P, la transformación lineal defmida por
T(a, + a , x + U 2 X 2 ) = (a, + a , ) - (2a, + 3 q ) x
a) Encontrar la matriz para T con respecto a las bases estándar B = { 1, x , 2)y B' = 1,
x paraP2 y P I .
b) Comprobar que la matriz [qF8
obtenida en el inciso a) satisface la fórmula (4a)
para todo vector x = c o + c I x+ cp2 en P2.
3. Sea TPz + P, el operador lineal definido por
T(a,
+ a,x + a$)
= U,)
+ a , ( x - 1) + u2(x
-
1)*
a) Encontrar la matnz para T con respecto a la base estándar B = { 1, x , 2)para P,.
b) Cotnprobar que la matriz [7JBobtenida en el inciso a) satisface la fórmula (5a) para
todo vector x = a,,+ a,x + u p 2 en Pz.
4. Sea T X 2 .+ R2 el operador lineal definido por
y sea B = u l , u2 la base para la cual
a) Encontrar [qe.
b) Comprobar que la fórmula (5a) secumple para todo vector x en R2.
8.4 Matrices de transformaciones lineales generales / 49 I
5. Sea T:R2+ R3 definido por
a) Encontrar la matriz [TIpB con respecto a las bases B = { ul, u2} y B' = {v,, V2,
donde
V3),
b) Comprobar que la fórmula (4a) secumple para todo vector
en R2
6. Sea TJ3 + R3defmido por T(x,, x, x3) = (xl - x, xz - x,, x1 - x3).
a) Encontrar la matriz para T con respecto a la baseB' = {vl, v,, v3}, donde
v , = ( l , O , l),
v 2 = ( 0 , 1, I ) ,
v 3 = ( 1 . 1,O)
b) Comprobar que la fórmula (5a) secumple para todo vector x = (x,, x*, x3)en R3.
7. Sea TP2 + P, el operador lineal definido por T(p(x)) = p ( k + 1); es decir,
T(c,
+
CIX
+ c2x2) = cg + c1(2x + I ) + cz(2x + 1)2
a) Encontrar [ T I B con respecto a la base B = { 1, x, 2).
b) Aplicar el procedimiento indirecto ilustrado en la figura 5 para calcular T(2 - 3x +
4.2).
c ) Comprobar el resultado obtenido en el inciso b) calculando directamente T(2 - 3x
+ 4.2).
8. Sea TP,+ P, la transformación lineal definida por T@(x)) = xp(x
T(c,
+ c , x + c$)
= X(C"
- 3); es decir,
+ c,(x - 3) + c2(x - 3)2)
a) Encontrar [qpB
con respecto a las bases B = { 1, x, ?} y B = { 1, x, 2,?}.
b) Aplicar el procedimiento indirecto ilustrado en la figura 5 para calcular T(l + x
2).
c) Comprobar el resultado obtenido en el inciso b) calculando directamente T( 1 + x
2).
-
492 / Transformaciones lineales
c) Encontrar una fórmula para T
d) Aplicar la fórmula obtenida en el inciso c) para calcular T
3 - 2
10. Sea
A =
[-i
:]
o
1
5
la matnz de of T : R"R3
con respecto
a las bases
(d)Usarlafórmulaobtenidaen(c)paracalcularT
(c) Encontrar una fórmul ~ a r a T [ [ ] ) .
m ) .
11. Sea A =
la matnz de of T :Pz -+ P, con respecto a la base
E = {v,, v2, v i ) , donde v I = 3x + 3x2, v2 =
-
1
+ 3x + 2x2,vj = 3 + 7x + 2 2 .
a> Encontrar [T(V,)l,,[T(v,)l,
y [T(V3)1*.
b) Obtener T(v,), T(vJ y T(v3).
c) Hallar una fórmula para T(uo+ a l x + U$).
d) Aplicar la fórmula obtenida en el inciso c) para calcular T( 1 + 2).
12. Sea T, PI+ P, la transformación lineal d e f ~ d por
a
y sea T2P2+- P, el operador lineal definido por
T,(p(xj) = p ( 2 x + 1)
8.4 Matrices de transformaciones lineales generales / 493
SeanB= {l,x}y B ' = {I,x,x?} lasbasesestándarparaP,yP,.
a) Encontrar T2O TI l B : B ? r 2 1 B ' > y [ TIl B ' , B .
b) Escribir una fórmula que relacione las matrices del ixiso a).
c) Comprobar que las matrices del inciso a) satisfacen la fórmula enunciada en el inciso b).
13. Sea T,:P, + P, la transformación lineal definda por
T,(co + c,x) = 2c0 - 3c,x
y sea T2F2+ P, la transformación lineal definda por
T,(co+ c,x
+ c2xZ) = 3c0x + 3
4
+ 3c2x3
SeanB={1,x},B"=(1,x,~}yBm={1,x,~,~}.
a) Encontrar [ T2 o TI ] B ' . B , [ T21B',B"i Y [ TI1B':B.
b) Escribir una fórmula que relacione las matrices del incisoa).
c)Comprobar que las matrices delinciso a) satisfacen la fórmulaplanteada en el
inciso b).
14. Demostrar que si T:V + W es la transformación cero, entoncesla matriz T con respecto
a bases cualesquiera para V y W es una matnz cero.
15. Demostrar que si T:V + V es una contracción o una dilatación de V (ejemplo 4 de la
sección 8. l), entonces la matriz para T con respecto a cualquier base para V es una
matriz diagonal.
16. Sea B = {v,, v2, v3, v4) una base para un espacio vectorial V. Encontrar la matriz con
respecto a B del operador lineal T V + V defindo por T(v,)=v2, T(v,)= v,, T(v3)= v4,
T(v4)= V I .
17. (Para quienes y a estudiaron C6lculo). Sea D I P , + P, el operador derivación
D(p)= p'(x). En los incisos a) y b), encontrar la matriz D con respecto a la base B
=
{PI,P,. PJ
(b) p, = 2, p2 = 2 - 3x, p3 = 2 - 3x + 8x2
c) Usar la matriz del incisoa) para calcularD(6 - 6x + 242).
d) Repetir las instrucciones del inciso c) para la matriz del inciso b).
a) p, = 1, p2 = x , p3 = x 2
18. (Para quienes ya estudiaron CcuCurO).En cada inciso,B = {f,,f2, f,} es una base para
un subespacio V del espacio vectorial de funcionescon valores reales defindas sobre la
recta real. Encontrar la matriz con respecto a B del operador derivaciónD:V -D V.
a) f, = 1, f2 = senx, f3 = cos x
c) f, = e2x, f2 = x e Z x , f3 = x 2 e Z X
b) f, = 1, f2 = e x , f3 = e 2 x
19. Demostrar: Si B y B' son las bases estándar para R" y R"', respectivamente, entonces la
matnz de la transformación lineal T8" + R"' con respecto a las bases B y B' es la
matriz estándar para T.
494
Transformaciones
lineales
8.5 SEMEJANZA
La matriz de un operador lineal T:V + V depende de la base elegida para V. Uno
de los problemas fundamentalesdel álgebra lineal es elegir una base para V que
simplijque la matriz para T; por ejemplo, diagonal o triangular. En esta sección
se estudiará esteproblema.
ELECCIÓN DE
BASES A FIN DE
OBTENER
MATRICES
SIMPLES PARA
OPERADORES
LINEALES
Las bases estándar no necesariamente producen a
ls matrices más simples para operadores heales. Por ejemplo, considérense el operadorlineal TR2 += R2 definido por
T([r:l)
=
[
-
2x,
'I'
+ 4x,
'2]
y la base estándar B = {el, e2>para R2, donde
Por el teorema 8.4.I, la matriz para T con respecto a esta base es la matriz estándar para T; es decir,
TI,
=[TI =
[ V e , ) I T(e2)l
de modo que
En comparación, en el ejemplo 4 de la sección 8.4 se demostró que si
entonces la matriz para T con respecto ala base B' ={ ul, u2} es la matriz diagonal
Esta matriz es más "simple" que (2) en el sentido de que las matrices diagonales
poseen propiedades especiales que no tienena
lsmatrices generales.
Uno de los temas principales en cursos más avanzados de álgebra lineal es
determinar la "forma más simple posible" que se puede obtener para la matriz un
operador lineal al elegir la base correcta. Algunas veces es posible obtener una
8.5 Semejanza / 495
matriz &agonal (como se acaba de hacer, por ejemplo); otras veces es necesario
establecer una matriz triangular o de alguna otra forma. En este texto sólo será posible mencionar la importancia de este tema importante.
El problema de determinaruna base que produzcala matriz más simple posible
para un operador heal T V V se puede atacar encontrando primerouna matriz para
T con respecto a cualquier base; por ejemplo una base estándar, cuandosea posible, y
luego cambiando la base de manera que se simplifique la matriz. Antes de prosegw
será de utilidadrepasar algunos conceptos sobre cambio de base.
con esta idea,
Recuérdese por la ftrmula (8) de la sección 6.5 que si B = {ul, u2, . . . , un}
y B' = { u ,u ,. . . ,u
son bases para un espacio vectorial V, entonces la
matriz de transición de B"a B está definida por la fórmula
-
, ,
1
L}
1
p
=
[[u;],
j
[u;],
j
' ' '
: [ull,]
Esta matriz posee la propiedad de que para todo vector v en
P[VIB' = [VI,
es decir, la multiplicación por P mapea la matriz coordenadas para v con respecto
a B' en la matriz coordenadas para v con respecto a B [véase la fórmula (7)] en la
sección 6.51 . En el teorema 6.5.4 se demostró que P es invertible y P" es la matriz de transición de B a B'.
RELACI~N
ENTRE LAS
MATRICES DE
TRANSICI~N
Y LOS
OPERADORES
IDENTIDAD
El siguiente teorema proporciona otro punto de vista útil sobre las matrices de
transición; muestra que la matriz transición de una base B' a una base B se puede
considerar como la matriz operador identidad.
Teorema 8.5.1. Si B y B' son bases para un espacio vectorial V de dimensión
finita y si I:V + V es el operador identidad, entonces [qBpes la matriz de
transición de B' a B.
Demostración. Supóngase
que
B = {u1, u2, . . . , un} y B' =
#
,
{ u ,u ,. .. ,u }son bases para V. Usando el hecho de que I(v) = v para todo v
en V, por la fórmula (4) de la sección 8.4, con B y B invertidas, se concluyeque
Así, por (5), se tiene [IjBg'
transición de B' a B. 0
=
P, lo cual demuestra que [JIBB' es la matriz
El resultado de este teorema se ilustra en la figura l .
Figura 1
I
Base = B'
Base = B
[ Z ] B , B 8 es la matriz de transici6n de B' a B.
I
496
' Transformacrones lineales
EFECTO DEL
CAMBIO DE
BASES SOBRE
MATRICES DE
OPERADORES
LINEALES
Ahora ya es posible considerar el problema principal de esta sección.
Problema. Si B y B' son dos bases para un espacio vectorial V de Imensión
finita y si T:V + V es un operador lineal, ¿qué relación existe, si la hay, entre
las matrices [goy [ qF?
Esta pregunta se puede contestar considerando la composición de los tres operadores lineales sobre V que se ilustra en la figura 2.
I
Y
Figura 2
V
V
V
V
Base = B'
Base
I
I'
=B
Base
V
= B
Base
=
B
En esta figura v primero es mapeado en sí mismo por el operador identidad,
luego v es mapeado en T(v) por T,luego T(v) es mapeado en sí mismoporel
operador identidad. Los cuatro espacios vectoriales de la composición son los
mismos (a saber, 4; sin embargo,a
ls bases para los espacios varían. Como el vector
inicial es v y el vector final es T(v),la composición es la misma que T; es decir,
T = 1 0T a l
(7)
Si, como se ilustra en la figura 2, a los espacios vectoriales primero y último se
asigna la base B' y a los dos espacios de enmedio se asigna la base B, entonces por
( 7 ) y la fórmula (15) de la sección 8.4 (con un ajuste apropiado en los nombres de
las bases) se concluye que
[ TIB',B' = [ I o T o l l B ' , B r
= [IIB',R[ TIB,B[llE,E'
(8)
o bien, en notación más simple,
Pero por el teorema 8.5.1 se deduce que [dBY,esla matriz transición de B' a B y
que, en consecuencia. I B'B es la matriz transmon de B a B'. Luego, si se hace P =
[ABB"entonces P" = [AEB,de modo que (9) se puede escribir como
[TI,,
=P
'[ T],P
En resumen. se tiene el siguiente teorema.
Teorema 8.5.2. Sea T:V + V un operador lineal sobre un espacio vectorial V
de dimensiónfinita, y sean B y B' bases para V. Entonces
I
I
I donde P es la matriz de transicion de B' a B.
.. .
8.5 Semejanza / 497
Advertencia. Cuando se aplica el teorema 8.5.2 es fácil olvidar si P es la matriz
transición de B a B' (incorrecto) o de B' a B (correcto). Puede ser útil escribir (10)
en la forma (9), teniendo en mente que los tres subindices "interiores" sonlos
mismos, y que los dos subindices exteriores son los mismos:
Una vez que se domina este patrón, basta recordar que P
transición de B' a B y que P" = [AFBes su inversa.
Ejemplo 1 Sea TR2
-
=
[ARB' es la
matriz
R2 definido por
T(
[:I) [ :
4 3
-2::
=
Encontrar la matriz T con respecto a la base estándar B = {el, e,} para R2, y luego
ap!icqr el teorema 8.5.2 para encontrar la matriz T con respecto a la base B' =
{ U I . U},
~donde
y
u;=[;]
u;=[;]
Solución. En esta sección ya se demostró ver (2) que
Para encontrar [
a partir de (10) es necesario encontrar la matriz transición
[ver (5)]. Por inspección,
+ e2
u; = e, + 2e2
u;
= e,
498
7iansformaciones lineales
de modo que
Así, la matriz transición de B' a B es
El lector puede comprobar que
de modo que por el teorema 8.5.2 la matriz T con respecto a la base B' es
lo que concuerda con (4). A
SEMEJANZA
La relación enla fórmula (10) es tan importante que existe terminología asociada
con ella.
Definición. Si A y B son matrices cuadradas, se dice que B es semejante a A
si existe una matriz invertible P tal que B = P"AP.
OBSERVACI~N.
Nótese que la ecuación B
=
P- 'AP se puede volver a escribir
como
Haciendo Q = P"
se obtiene
que establece que A es semejante a B; por tanto, B es semejante a A si y sólo si A
es semejante a B; así, en general, simplemente se &rá que A y B son semejantes.
INVARIANTES
BAJO
SEMEJANZA
Las matrices semejantes a menudo tienen propiedades en común; porejemplo, si A
y B son matrices semejantes, entonces A y B tienen el
mismo determinante. Para
darse cuenta de que así es, supóngase que
B
= P"AP
8.5 Semejanza / 499
Entonces
det(B) = det( P"AP)
-
1
det ( P)
= det(
P")det(A)det( P)
det ( A )det ( P) = det ( A )
Se hace la siguiente definición.
Definición. Sediceque una propiedaddelasmatrices cuadradas es invariante
bajo semejmzu si tal propiedad es comparbda por dos matrices semejantes cualesquiera.
una matriz cuadrada es un invaEn los términosde esta definición, el determinante de
riante bajo semejanza. En la tabla 1 se enumeran otros invariantes bajo semejanza importantes. La demostración dealgunos de los resultados de la tabla1 se proporciona en
los ejercicios.
Por el teorema 8.5.2 se concluye que dos matrices que representan al mismo
operador lineal T:V + V con respecto a dos bases diferentes son semejantes. Entonces, si B es una base para V y la matriz [qB
posee alguna propiedad que no
varía bajo semejanza, entonces para toda base B' la matriz [qEtiene la misma
propiedad. Por ejemplo, para dos bases cualesquiera B y B' se debe tener
Por esta ecuación se concluye que el valor del determinante depende de T, pero no
de la base particular que se usa para obtener la matriz para T. Así, el determinante
se puede considerar como una propiedad del operador lineal T; de hecho, si V es
un espacio vectorial de dimensión finita, entonces el determinante del operador
lineal T se puede dejnir como
TABLA l. Znvariantes bajo semejanza
Descripción
Propiedad
Determinante
A y P"AP tienen el mismo determinante.
Invertibilidad
A es invertible si y sólo si P- 'AP es invertible.
A y P"AP tienen el mismo rango.
Nulidad
A y P-lAP tienen la misma nulidad.
Traza
A y P"AP
tienen la misma traza.
Polinomio característico A y P"AP tienen el mismo polinomio característico.
Eigenvalores
A y P"AP tienen los mismos eigenvalores.
Dimensión del
eigenespacio
Si 1 es un eigenvalor de A y P"AP, entonces el
eigenespacio de A correspondiente a 1 y el
eigenespacio de P"AP correspondiente a 1 tienen la
misma dimensión.
d e t ( T ) -= det([ T I R )
donde B es cualquier base para V.
Ejemplo 2 Sea T:R2+ R2 definido por
[
T ( [ ~ J )=
14zI]
-2::
Encontrar det(7).
Solución. Puede elegirse cualquier base B y calcular det( [ TIB). Si se considera la
base estándar, entonces por el ejemplo 1
de modo que
det(T)=
Si se hubiese elegido la base B'
obtenido
=
1 '1
-2
=6
{u1, u2} del ejemplo 1, entonces se hubiera
Por tanto
det(T)=
1 1
2
o
lo cual concuerda con el cálculo precedente.
UN EJEMPLO
GEOMÉTRICO
4
0
=6
3
A
Ejemplo 3 Sea 1 la recta en el plano xy quepasa por elorigen y forma un
ángulo con el eje x positivo, donde O 5 8 < n. Como se ilustra en la figura 3 ,
sea T:R2 + R2 el operador lineal que mapea cada vector en su reflexión con
respecto a la recta 1.
8.5 Semejanza / 501
a) Encontrar la matriz estándar para T.
b) Encontrar la reflexión del vector x = (1, 2) con respecto a la recta 1 que pasa
por el origen y forma un ángulo 8 = n/6 con el eje x positivo.
Solución de a). Se podría proceder como en elejemplo 5 de la sección 4.3 e
intentar construir la matriz estándar a partir de la fórmula
B' = {u;,u;}
es labase que consta de un vector unitario u;a lo largo de 1y de un vector unitario
i2perpendicular a I (figura 4).
f'
Una vez que se ha encontrado [TJEse efectúa un cambio de base para enLos cálculos son como sigue:
contrar [qB.
T(u;)= U ;
y
T(u;)=
-U;
de modo que
Por tanto,
Por los cálculos en el ejemplo 6 de la sección 6.5, la matriz transición de H' a B es
.. . .
502 1 Transformaciones lineales
Por la fórmula (10) se deducs que
[ T I , = P[T],,P"
Así, por (12) la matriz estándar para
[ T I = P[ T],#P"
=
T es
[cos 8
sen8
-senO][l
cos 8 O
O][
-1
cos 8 sen8
-sene cos 0
cos2 8-sen28 2 sen8cos 8
2 sen e cos 8 sen28 - cos2 8
cos 28
sen28
1
sen 28
-cos 28
Solución de b). Por el inciso a) se concluye que la fórmula para T en notación
matricial es
Sustituyendo 8 = n/6 en esta fórmula se obtiene
de modo que
EIGENVALORES
DE UN
OPERADOR
LINEAL
Los eigenvectores y los eigenvalores sepueden definir para operadores lineales
también como matrices. Un escalar A se denomina eigenvalor de un operador lineal
T:Y + V si en V existe un vector x diferente de cero tal que Tx = Ax. El vector x se
denomina eigenvector de T correspondiente a A. De manera equivalente, los
eigenvectores de T correspondientes a A son los vectores diferentes de cero en el
núcleo de AI - T (ejercicio 15). Este núcleo se denomina eigenespaciu de T
correspondiente a A.
Se puede demostrar que si V es un espacio vectorial de dmensión finita y B
es cualquier base para Y, entonces
l. Los eigenvalores de T son iguales a los eigenvalores de [ TIB.
2. Un vector x es un eigenvector de T correspondiente a A si y sólo si su matriz
coordenadas [x]B es un eigenvector de [ TIB correspondiente a A.
8.5 Semejanza
1'
503
Se omiten las demostraciones.
Ejemplo 4 Encontrar eigenvalores y bases para los eigenespacios deloperador
lineal T:P, + P, definido por
= { 1, x, x2} es
Solución. La matriz Tcon respecto a la base estándar B
(comprobar). Los eigenvalores de T son 1 = 1 y 1 = 2 (ejemplo 5 de la sección 7.1).
También por ese ejemplo, el eigenespacio de [ T J Bcorrespondiente a 1 = 2 tiene la
base [u1, u,}, donde
y el eigenespacio de I T J B correspondiente a 1 = 1 tiene la base { u3}, donde
Las matrices ul, u, y u3 son las matrices de coordenadas con respecto aB de
p1 = - 1
+2
,
p2 = x,
p3 =
-
2
+ x + x2
Así, el eigenespacio de T B correspondiente a 1 = 2 tiene la base
y el correspondiente a 1 = 1 tiene la base
(p3)
=
(-2 +x+x2}
Como comprobación, el lector debe usar la fórmula dada para T a fin de verificar
que í"(PI) = 2P,> T(P,) = 2P, Y T(P3) = P3. A
Ejemplo 5 Sea T:R3-,
R3 el operador lineal definido por
504
/
Transformaciones lineales
Encontrar una base para R3 con respecto a la cual la matriz para T sea diagonal.
Solución. Primero se encontrará la matriz estándar para Tr luego se buscarh un
cambio de base que diagonalice la matriz estándar.
Si B = {el, e2,e3>denota la base estándar para R3, entonces
de modo que la matriz estándar para T es
,
(
I
Ahora se quiere cambiar de la base estándar B a una nueva base B' = {uI,u2,u3}a
finde obtener una matriz diagonal para T. Si se hace que P sea la matriz
transición de la base desconocida B' a la base estándar B, entonces por el teorema
8.5.2 las matrices T y [qB'
se relacionan mediante
En el ejemplo 1 de la sección 7.2 se encontró que la matriz la expresión (1 3) es
diagonalizada por
o
-1
P=[
o
1
1
o
-21
1$
9
,
Como P representa la matriz transición de la base B' = (ul,u2,u,>a la base
estándar B = {el, e2, e,},las columnas de P son [ u;]B, [ &IB, y [ u3IB, de modo
que
Por tanto,
u;
=
( - l)e,
+ (O>e,+ (l)e3 =
U; =
(O)e, + (I)e,
U; =
(-2)e,
+ &Ve3 =
[:I
8.5 Semejanza i 505
1
+ (I)e2 + (])e3 =
son vectores básicos que producen una matriz diagonal para [í''IP. Como comprobación, en seguida se calculará directamente [í''IB'.Por la fórmula dada para T se
tiene que
T(u;) =
[-p]
= 2u;,T(&)
=
[i]
=2
4,
Esto es consistente con (14), ya que
EJERCICIOS DE LA SECCIóN 8.5
En los ejercicios del 1 al 7 encontrar la matnz T con respecto a B, y usando el teorema
8.5.2 para calcular la matriz T con respecto a B'.
1. T.R2 + R2 está definido por
B = {u,,u2} y B ' = {vl, v2}, donde
T(u;)
=
[-y]
= U;
506 í Transformaciones lineales
2. TR2 + R2 está definido por
3. TR2 + R2 es la rotación de 45O conrespectoalorigen;
ejercicio 1.
4.
[; I)
B y B son las basesdel
TR3+ R3 está definido por
T(
[]3x'-,:X+I + 7x3
B es la base estándar para R3 y B = {v,, v2, v3}, donue
5. TB3+ R3 es la proyección ortogonal sobreel plano q,
B y B' son como en el ejercicio
4.
6, TB2 + R2 está definido por T(x) = 58;B y B son las bases del ejercicio 2
7. TP,+ P , está definido por T(ao + a,x) = a. + a,(x + 1); B = {p,, pz} y B = {q,, q2},
donde p, = 6 + 3x, p2 = 10 + 2 x , q, = 2, q2 = 3 + 2x.
8. Encontrar det(T)
a) T :R2-+R2, donde T(x,,x,) = (3x,- 4x,,
b) T : R3-+R3, donde T ( x , , x,, x3)= (x1-x,,
c) T :P2+ P,, donde T(p(x))= p ( x - 1)
-x1 + 7x,)
x, - xj, xj - xI)
9. Demostrar que las siguientes características son invariantes bajo semejanza
a) Rango.
b) Nulidad.
Invertibilidad.
c)
10. Sea TP4+ P4 el operador lineal definido por la fórmula T@(x)) =p(2x + 1).
a) Encontrar una matnz para T con respecto a alguna base conveniente; luego, usando
el resultado del ejercicio 9, encontrar el rango y la nulidad de T.
b) Con el resultado del inciso a), determinar si T es uno a uno.
11. En cada inciso, hallar una base para R2 con respecto a la que la matriz para T sea diagonal.
8.5 Semejarlza
a) T(
[:I)
=
”1
[
2x, + 4x2
b) T (
[:I) [
=
+
- 4x1
3x1 x2
12. En cada inciso, encontrar una base para R3 con respecto a la que la matriz para T sea
diagonal.
13. Sea TP,-* P, defindo por
T(u,
+ U,X + a2x2)= (5u0 + 6 ~ +, 2u2)- + ~ u , ) x+ (uo- 2u2)x2
(U,
a) Encontrar los eigenvaloresde T.
b) Hallar bases para los eigenespaciosde T
14. Sea TMZ2+ Mz2 definido por
.([:;I)= [
u+
dc]
b -2c
2c
a) Encontrar los eigenvalores de T.
b) Obtener las bases para los eigenespacios de T.
15. Sea 1 un eigenvalor de un operador lineal T V + V. Demostrar que los eigenvectores de
T correspondientesa I son los vectores diferentes de cero enel núcleo de II T.
-
16. Demostrar que si A y B sonmatricessemejantes,entonces
A’ y BZ tambiénson
semejantes. De manera más general, demostrarque Ak y Bk son semejantes, dondek es
un cualquier entero positivo.
X n, y sea B = {v,, v,,. . . , vn} una base para un espacio
vectorial V. Demostrar que si C[x], = D[x], para todo x en V, entonces C = D.
17. Sean C y D matrices m
18. Sea I una recta en el plano xy que pasa por el origen y forma un ángulo 8 con el eje x
positivo. Como se ilustra en la figura 5, sea TB2 + R2 la proyección ortogonal de R2
sobre 1. Con el método del ejemplo 3, demostrarque
[ I]) [
=
cos2 e
sene cos
e
sen O cos
sen2e
[Nota Ver el ejemplo 5 de la sección 4.3.1
t”
y (X.”)
\
1
e]
[;]
i
507
508 / Transformaciones lineales
EJERCICIOS COMPLEMENTARIOS
X n, B una matriz n X 1 diferente de cero y x un vector en R"
expresado en notación matricial. ¿Es T(x) = Ax + B un operador lineal sobre R"?
Justificar la respuesta.
L. Sean A una matriz n
2. Sea
A=
[
cos 8
sen8
-sen0
cos 0
1
a) Demostrar que
A'=
[
cos 28
sen20
-sen28
cos 20
y
-sen30
cos 30
sen30
A3=[
cos 30
1
b) Conjeturar la forma de la m a w A" para cualquier entero positivo n.
c) Considerando el efecto geométrico de TB2 + R2, donde T es la multiplicación por
A , obtener geométricamente el resultado del inciso b).
3. Sea vo un vector fijo en un espacio V con producto interior, y sea T:V -D V definido por
T(v) = (v, vo)vo. Demostrar que T es un operador lineal sobre V.
4. Sean Y ,., Y,,I . . . , v m vectores fijos en R", y sea TR" + Rmla función definda por T ( x )
= (x * v,, x . v2, . . . , x * vm),donde x . vi es el producto interior euclidiano sobre R".
a) Demostrar que T es una transformación lineal.
b) Demostrar que la matriz con vectores renglón vl, v2, . . . , vm es la matriz estándar
para T .
5. Sean fe,, e2, e3, e4} la base estándar para @ y T@ + R3 la transformación lineal para
la cual
T ( e , ) = (1, 2. 11,
V e , ) = (1, 3, O),
7Ye2)=(O, 1, O),
T(e,) = (1, 1, 1)
a) Encontrar bases para el recomdo y el núcleo de T.
nulidad de T.
b) Encontrar elrango
6. Supóngase que los vectores en R3 se denotan por matrices de 1
R3 por
-1
m x ,
x2
%I)
=
[x,
x2
%I/
2 4-
3 O I]
2 2 5
a) Encontrar una base para el núcleo de T.
b) Encontrar una base para el recomdo de T .
X
y la
3, y definase TR3-D
Ejercicios complementarios / 509
7. Sean B = {v,, v,, v3, v4} una base para un espacio vectorial V y T:V + V el operador
lineal para el que
T(V,) = V I v2 + v3 3v4
+
+
T(v,) = V I - v2 + 2v, + 2v,
T(v,) = 2v, - 4v2 SV, + 3v,
T(v,) = -2v1 + 6v2 - 6v3 - 2 ~ 4
a) Encontrar el rango y la nulidad de T..
b) Determinar si T es uno a uno.
+
8. Sean V y W espacios vectoriales, T, TI y T, transformaciones lineales de V a W y k un
escalar. Nuevas transformaciones, TI + T, y kT, se definen mediantelas fórmulas
(TI + T2)(x) = T d X ) + T2(x)
(kT)(x) = k(T(x))
a) Demostrar que (TI + T,): V W y kT: V + W son transformacioneslineales.
b) Demostrar que el conjunto de todas las transformaciones lineales de V a W con las
operaciones del incisoa) forman un espacio vectorial.
9. Sean A y B matnces semejantes. Demostrar lo siguiente:
a) y B~ son semejantes.
b) Si A y B son invertibles, entonces A" y B" son semejantes
10. (Teorema alferna&ivode Fredholm). Sea T:V + V un operador lineal sobreun espacio
vectorial n dimensional. Demostrar que se cumple exactamente una de las siguientes
proposiciones:
i) La ecuación T(x) = b tiene una solución para todos los vectoresb en V.
ii) Nulidad de T > O.
11. Sea TM,,
+ M,,
el operador lineal definido por
Encontrar el rango y la nulidad de T.
12. Demostrar: Si A y B sonmatrices semejantes y si
C y D son matrices semejantes,
entonces A y C son matrices semejantes.
13. Sea TM,, + M,, el operador lineal defindo por T(M) = MT. Encontrar la m a w para
T con respecto ala base estándar para M2,.
14. Sean B = {u1,u2, u3}y B' = {v,, v,, v3} bases para un espacio vectorial V, y sea
P=[!
-
j
ij
la matriz transición de 6' a B
a) Expresar v l , v2, v3como combinaciones lineales de ul, u2,u3.
51 O
_/'
lransformaciones lineales
b) Expresar u , , u*, u3 como combinaciones lineales de v,, v2, vj
15. Sean B = {u,, u2, u3} una base para
un espacio vectorial V y T:V
* Y un operador
lineal tal que
-3
4
7
Encontrar [TIB',donde 8 = {vl, v2, v3] es la base para Y definida POI
16. Demostrar que las matrices
son semejantes, pero que
[-1 -:I
y
[
-I
2
1
o]
no lo s o x
17. Supóngase que T: V + Ves un operador lineal y que B es una base para V tal que para
cualquier vector x en V
Encontrar [ TI,.
18. Sea T:V + Vun operador lineal, Demostrar que T es uno a uno si y sólo si det(l")
f
O
19. (Para quienes ya esfudimon Cálculo).
m ) + F( - m , QJ)definida por D ( f ) =f'(x) es
una transformación lineal.
h) Encontrar una base para el núcleo de D.
c) Demostrar que l a fimción que satisface la ecuación D ( f ) = A x ) forma un subespacio
bidimensional de C 2 ( - m , m ) , y encontrar una base para este subespacio.
a) Demostrar que la función D:C2(- m ,
r:J
20. Sea TP2 + R3 la función d e f ~ d por
a la fórmuia
T ( P ( - d )=
P(0)
a) Encontrar T(x' + 5x + 6).
b) Demostrar que T es una transformación lineal
c) Demostrar que T es uno a uno.
d) Encontrar
Ejercicios complementarios 1 51 1
e) Trazar la gráfica del polinomio del mciso d).
21. Sean xl, x, y,x3 números reales distintos tales que x , < x, < x3, y sea TP, +R3 la
función definida por la fórmula
a) Demostrar que T es una transformación lineal.
b) Demostrar que T es uno a uno.
c) Comprobar que si a l ,a2 y a3 números reales cualesquiera, entonces
donde
d) ¿Qué relación existe entre la gráfica de la función
a,P,(x)+ @2(4
+ @,(X)
Y 10s puntos (X1>al),(x,.
a2) Y (x3,a,)?
22. (Para quienes y a estudiaron CcuCub).Sean p ( x ) y q(x) funciones continuas,y sea V el
subespacio de C( - m , 00) que consta de todas las funciones que son derivables dos
veces. L:V * V se define como
a) Demostrar que L es un operac'or lineal.
b) Considérese el caso especial en que p ( x ) = O y q(x) = l . Demostrar que la función $(x) = c, sen x + c2 cos :
es el espacio nulo de L para todos los valores reales
de c, y c2.
23. (PWQquienes y a estudiaron CcuCub). Sea D P n + P, el operador derivación D(p) =
p'. Demostrar que la matriz para D con respecto a la base B = { 1, x, 2,. . . ,X} es
-0 1 o o ' ' _
O O 2 O " ' O
O O O 3 " ' O
..
.
..
.
..
.
o1
..
.
0 O O O " ' n
0 0 0 0 " ' 0
-5 I 2
'
Transformaciones lineales
24. (Para quienes ya estudiaron Cdkulo). Puede demostrarse que para cualquier número
real c, los vectores
(x
I , 1 - l ' , --.
~~
c.)>
...,
2!
(x
~
c.)"
I2 !
formanuna base para P,,. Encontrar la matriz para eloperadorderivacion
qerclcio 23 con respecto a esta base.
25. (Para quienes ya estudiaron Cálculo). Sea J:P,
+=
P,,
del
la transformación integración
definida por
(u,,+a,x+"'+cl,,x")d.~=a,,s+-.u
u1 2
2
donde p = U +
+..
estándar para P,, y Pn+,.
.
+...+a,*""
n+ I
+ a,.". Encontrar la matriz para J con respecto a las bases
9.1
APLICACIONES A LAS ECUACIONESDIFERENCIALES
Muchas leyes de fisica, química, biología y economia están descritas en términos
de ecuaciones diferenciales; es decir, ecuaciones en lasque aparecenfunciones y
sus derivadas. El objetivo de esta sección es ilustrar una forma en que se puede
aplicar el álgebra lineal para resolver ciertos sistemas de ecuaciones
diferenciales. El alcance de esta sección es corto, aunque ilustra un área importante de
aplicación del álgebra lineal.
TERMINOLOGÍA Una de las ecuaciones diferenciales más simples es
donde y =fix) es una función desconocida a determinar, y' = dy/dx es su derivada
y a es una constante. Como casi todas las ecuaciones diferenciales, (1) tiene
infinidad de soluciones; se trata de las funciones de la forma
y
(2 1
= tea'
donde c es una constante cualesquiera. Cada función de esta forma es una solución
de y' = ay, ya que
y'
= caeaX -
QY
514
/
Temas complementarios
Recíprocamente, toda solución de y' = ay debe ser una función de la forma cem
(ejercicio 7). de modo que (2) describe las soluciones de y' = ay. La expresión (2)
se denomina solución general de y' = ay.
Algunas veces el problema físico que genera
una ecuación diferencial
impone alguna condición agregada que permite aislar unasolución particular
de la solución general. Por ejemplo, si se requiere que la solución de y' = ay
cumpla la condición agregada
y(0)
=3
(3 )
es decir, y = 3 cuando x = O, entonces al sustituir estos valores en la solución general de y = ce" se obtiene un valor para c, a saber,
Así,
es la única solucih de y' = a-v que satisface la condición agregada. Una condición
como (3), que especifica el valor de la solución en un punto, se denomina
condición inicial, y el problema de resolver una ecuación diferencial sujeta a una
condición inicial se denominaproblema con valor inicial.
SISTEMAS
LINEALES DE
ECUACIONES DE
PRIMER ORDEN
En esta sección se explica cómo resolver sistemas de ecuaciones diferenciales de la
forma
donde y1 =fi(x), y z =&(x), . . . ,yn =&(x) son funciones que serán calculadas y
las a,, son constantes. En notación matricial, (4) se'puede escribir como
o, más brevemente, como
Y' = A Y
Ejemplo 1
a) Escribir el siguiente sistema en forma matricial:
9.1 Aplicaciones a las ecuaciones diferenciales / 515
3y1
Y; =
Y;
=
-2Y2
5Y3
Y; =
b) Resolver el sistema.
c) Obtener una solución del sistema que cumpla las condiciones iniciales y , (O)
1, YZ(0) = 4 Y Y3(0) = -2.
=
Solución de a).
o
3
0
-2
O
0
Y1
Y2
Y3
o bien,
3
y' =
0
-2
O
0
o
Y
Solución de 6). Debido a que en cada ecuación hay sólo una función desconocida, las ecuaciones se pueden resolver individualmente. Por (2) se obtiene
y I = cle3x
y 2 = c2e
y, = c3e5x
o bien, en notación matricial,
Solución de c).
A partir de las condiciones iniciales dadas, se obtiene
I = y,(O) = Cleo= c ,
4
= y2(0)= czeo= c2
- 2 = y,(O) = e j e o = c,
de modo que la solución que satisface las condiciones iniciales es
o bien, en notación matricial.
516
Temas complementarios
El sistema delejemplo precedente es fácil deresolver porque para cada
ecuación sólo hay una función desconocida, y este hecho se debea que lamatriz de
coeficientes (5) para el sistema es diagonal. Sin embargo, ¿cómo manejar un sistema
Y' = A Y
en el que la matriz A no es diagonal? La idea es sencilla: se intenta hacer una
sustitución para Y con la que se &tenga un nuevo sistema con una matriz de coeficientes diagonal; se resuelve este nuevo sistema más simple y luego se usa esta
solución para determinar la solución delsistema original
El tipo de sustitución que se tiene en mente es
o bien, en notación matricial,
o, más brevemente.
En esta sustitución, los coeficientesp,, son constantes por determinar de forma que
el nuevo sistema con las funciones desconocidas ul, u2, , , . , un tenga una matriz
de coeficientes diagonal. Se deja como ejercicio para el lector derivar cada ecuación en (6) y obtener
Y' = PU'
Si se efectúan las sustituciones Y = PU y
Y = P U en el sistema original
Y' = A Y
9.1 Aplicaciones a las ecuaciones dqerenciales / 517
y si se supone que P es invertible, se obtiene
PU'
= A(PU)
o bien,
U'
= (P"AP)U
o bien,
U'
= DU
donde D = P-lAP. La elección de P resulta evidente ahora; si se quiere que la
nueva matriz de CoeficientesD sea diagonal, P se debe elegir a P como una matriz
que dagonalice a A .
PROCEDIMIENTO PARA
RESOLVER UN
SISTEMA DE
ECUACIONES
DIFERENCIALES
LINEALES DE
PRIMER ORDEN
Lo anterior sugiere el siguiente procedimiento para resolver un sistema
Y' =AY
con una matriz de coeficientes diagonalizableA .
-
Paso 1.
Encontrar una matriz P que diagonalice a A .
Paso 2.
Hacer las sustituciones Y = PU y Y = P V para obtener unnuevo
"sistema diagonal" I/" = DU, donde D = P"AP.
Paso 3.
Resolver V = DU.
Paso 4.
Determinar Y a partir de la ecuación Y = PU.
Ejemplo 2
a) Resolver el sistema
Y;= Y,+
Y2
y; = 4yI - 2y2
b) Encontrar la solución que cumpla las condiciones iniciales
Y l ( 0 )= 1, Y2(0>= 6.
Solución de a).
La matriz de coeficientes para el sistema es
518
1
Temas complementarlos
Como se explicó en la sección 7.2, A es diagonalizada por cualquier matriz P
cuyas columnas sean eigenvectores de A linealmente independientes. Como
det( dl - A ) =
los eigenvalores deA son A
d"1
-4
= 2,A =
I
-1
=d2+d-6=(A+3)(d-2)
a+Z1
- 3 . Por definición,
es un eigenvector de A correspon&ente a A si y sólo si x es una solución no trivial
de (Al - A)x = O, es decir, de
Si A
= 2.
este sistema se convierte en
Resolwendo este sistema se obtiene
x1
= 1,
x2 = t
de modo que
Asi,
es una base para el eigenespacio correspondiente a A
lector puede demostrar que
= 2.
De manera semejante, el
es una base para el eigenespacio correspondiente a A = -3 . Así,
9.I Aplicaciones a las ecuaciones diferenciales / 5 19
diagonaliza a A y
[:,
D=P"AP=
-;I
Por consiguiente, la sustitución
Y=PU
Y'
4
= PU'
produce el nuevo "sistema diagonal"
Por (2), la solución de este sistema es
u , = c,e2"
u2 = c2e p 3 x
u=
O
de modo que la ecuación Y = PU produce como soluciónpara Y a
Cle2"
- 1, e
-3x
c,e2*+ 4 c2e
-- 3x
2
o bien,
I
y , = c l e 2 x- $c2e - 3 x
y2 = c l e 2 x+ c2e - 3 x
Solución de 6).
Si las condiciones iniciales dadas se sustituyen en (7), se obtiene
c, - $c2 = 1
c,+ c 2 = 6
La solución de este sistema es
c , = 2,
c2 = 4
de modo que por (7) la solución que satisface las condiciones iniciales es
En esta sección se ha supuesto que la matriz de coeficientes de Y = AY es
diagonalizable. En caso de no serlo, se deben usar otros métodos para resolver el
sistema. Estos métodos se analizan en textos más avanzados.
520 /' Temas complementarios
EJERCICIOS DE LA SECCIóN 9.1
1. a) Resolver el sistema
Y ; = Y1 + 4.h
= 2y, + 3y,
y;
b) Encontrar la solución que satisface las condiciones inicialesyl(0) = O,y,(O) = O.
2. a) Resolver el sistema
y; = y,
+ 3v2
y; = 4.h
+ 5Y,
b) Encontrar la solución que satisface las condiciones inicialesyl(0) = 2, y2'(0)= l .
3. a) Resolver el sistema
y;=
4y,
+ y3
y; = - 2 v , +y,
Y; = -2%
+ Y3
b) Encontrar la solución que satisface las condiciones iniciales y ,(O) = - 1, y2(0)= 1,
Y,(O) = 0.
4. Resolver el sistema
5. Resolver la ecuación diferencial y" - y'
- 6y = O. [Sugerencia. Hacer y , = y ,
y=
2 y' y
luego demostrar que
Y ; =Y2
y; = y '
-Y'
+ 6~ = 6.~1+ y21
7. Demostrar: Toda solución de y' = ay es de la forma y = cP.
[Sugerencia.Sea y
una soluci6n y demostrar quef(x)e-ares constante.]
8. Demostrar: Si A es diagonalizable y
=AX)
9.2 Geometría de los operadores lineales sobre R2 1 521
satisface Y' = A Y , entonces todo yi es una combinación lineal de dlx,db,.
donde A,, A,, . . . ,A,, son eigenvaloresde A .
. .
, dm,
9.2 GEOMETRíA DE LOS OPERADORES LINEALES SOBRE R *
En la sección 4.2 se estudiaron algunas propiedadesgeometricas de los operadores lineales sobre R2 y R3. En esta sección se estudiarán con mayor profundidad
los operadores lineales sobre R2. Algunas de las ideasque se presentarán poseen
importantes aplicaciones al campo en desarrollo de la elaboración de grájicas
por computadora.
+.
Si T:R2 R2 es el operador matricial cuya matriz estándar es
entonces
Existen dos interpretaciones geométricas igualmente aceptables de esta fórmula.
Los elementos de las matrices
[;I
ax + by
[U+dYl
y
se pueden considerar como componentes devectores o como coordenadas de
puntos. Con la primera interpretación, T transforma flechas en flechas y con la
segunda, puntos en puntos (figura 1). L a elecciónde
cualquiera de estas
interpretaciones es una cuestión subjetiva.
t'
o
(ax + by, cx + d y )
\
\
\
\
\
\
\
(X,Y)
Figura 1
...
. .. .
"
-. . ...
,
-.
.
...
I T mapea vectores en"-4
vectores.
...
.
X
T mapea puntos en puntos.
b
522
/
Temascomplementarios
En esta sección, los operadores lineales sobre R2 se considerarán como
transformaciones de puntos en puntos. Una manera de representar el comportamiento de un operador lineal es observar su efecto sobre los puntos de figuras
sencillas en el plano. Por ejemplo, en la tabla 1 se muestra el efecto de algunos
operadores lineales básicos sobre un cuadrado unitario que se ha coloreado parcialmente
‘ABLA 1
Operador
Matriz estándar
Reflexión con
respecto al eje y
[-A
Y]
Reflexión con
respecto al eje x
[A
-Y]
0
-sen0
Efecto sobre el cuadrado unitario
4 .)
1
.:I,
,
I
.
! I,
.
1,
Reflexión con
respecto a la recta
?/=X
Rotación en
sentido contrario a
las manecillas del
reloj por un ángulo
COS
sen0
1
cos 8
En la sección 4.2 se analizaron reflexiones, proyecciones, rotaciones, contracciones y dilataciones de R2. A continuación se considerarán otros operadores
lineales básicos sobre R2.
9.2 Geometría de los operadores lineales sobre R2
EXPANSIONES Y
COMPRESIONES
523
Si la abscisa de cada punto del plano se multiplica por una constante positiva k,
entonces el efecto es expandir o comprimir cada figura del plano en la dirección x.
Si O < k < 1, el resultado es luna compresión, y si k > 1, una expansión (figura 2).
Un operador así se denomina expansión (o compresión) en la dirección x con
factor k. De manera semejante, si la ordenada de cada punto delplano se
multiplica por una constante positiva k, se obtiene una expansión (o compresión)
en la dirección y con factor k. Se puede demostrar que las expansiones y las
compresiones a lo largo de los ejes de coordenadas son transformaciones lineales.
p;
Figura 2
I (Cuadrado unitario) I I(Compresión) k = 4
[(Expansión) k = 2
Si T:R2 + R2 es una expansión o una compresión en la dirección x con factor k,
entonces
de modo que la matriz estándar para T es
De manera semejante, la matriz estándar para una expansión o una compresión en
la dirección y es
Ejemplo 1 Supóngase que el plano xy primero se expande o comprime por un
factor k , en la hrección x y que luego se expande o comprime por un factor k, en
la dirección y. Encontrar un solo operador matricial que efectúe ambas operaciones.
Solución. Las matrices estándar para las dos operaciones son
Expansión x (compresión)
....
.
Expansión y (compresión)
524
,I
Temas complementarios
Así, la matriz estándar para la composición de la operación x seguida de la
operación y es
En el caso especial en que k , y k, son iguales, por ejemplo k ,
(2) se simplifica a
= k, = k,
nótese que
que es una dilatación o una contracción (tabla 8 de la sección 4.2). A
DESLIZAMLENTOS
CORTANTES
Figura 3
Un deslizamiento
cortante
en la
dirección
x con factor k es una
transformaciónque mueve cadapunto (x, y ) paralelo al eje x en unacantidad ky
hastala nueva posición (x + ky, y>.Bajo unatransformacióndeeste
tipo, los
puntos que están sobre el eje x no se mueven porque y = O. Sin embargo, a
medidaqueseavanzaalejándose
del eje x, la magnitudde y aumenta,de
modo que aquellos puntos más alejados del eje x recorren una mayor distancia
que los puntos más próximosa él.
Cuadrado unitario.
Oblongamiento en la direcciónx con factor k.
Un deslizamiento cortante en la dirección y con factor k es una transformación que mueve cada punto (x, y ) paralelo al eje y en una cantidad IQC hasta la
nueva posición (x, y + h).
Bajo una transformación de este tipo, los puntos que
están sobre el eje y permanecen fijos, y los puntos alejados del eje y recorren una
mayor distancia que los puntos próximos a él.
Se puede demostrar que los deslizamientos cortantes son transformaciones
lineales. Si T:R2 + R2 es un deslizamiento cortante con factor k en la dirección x,
entonces
9.2 Geometría de los operadores lineales sobre R2 / 525
de modo que la matriz estándar para T es
De manera semejante, la matriz estándar para un deslizamiento cortante en la
Irección y con factor k es
La multiplicación por la matriz identidad 2 X 2 es el operador
identidad sobre R2. Este operador se puede considerar como una rotación de Oo,
como un deslizamiento cortante a lo largo de cualquiera de los dos ejes con k = O,
o como una compresión o expansión a lo largo de cualquiera de los dos ejes con
factor k = l .
OBSERVACI~N.
Ejemplo 2
a) Hallar una matriz de transformación de R2 en R2 que primero efectúe un deslizamiento cortante en la dirección x con factor 2 y luego realice una reflexión
con respecto ay = x.
b) Encontrar una matriz de transformación de R2 en R2 que primero efectúe una
reflexión con respecto ay = x y luego un deslizamiento cortante en la dirección
x con factor 2.
Solución de a). La matriz estándar para el deslizamiento cortante es
y para la reflexión es
Así, la matriz estándar para el deslizamiento cortante seguido de la reflexión es
A , A , = [O1
Solución de b).
'][I
0 0
'1 = [ y :]
1
La reflexión seguida del deslizamiento cortantese representa como
526
Temas complementarios
En el último ejemplo, nótese que A ,A2 f A#
de modo que el efecto de
aplicar primero el deslizamiento cortante y luego la reflexión es diferente al efecto
de aplicar primero la reflexión y luego el deslizamiento cortante. Este hecho se
ilustra geométricamente en la figura 4, donde se muestra el efecto de las transformaciones sobre un cuadrado unitario.
t'
11. I
-.
Figura 4
Ejemplo 3 Demostrar que si T R 2 + R2 es la multiplicación poruna
elemental, entonces la transformación es una de las siguientes:
matriz
a> Un deslizamiento cortante a lo largo de un eje de coordenadas.
Una reflexión con respecto a y = x.
Una compresión a l o largo de un eje de Coordenadas.
Una expansión a lo largo de un eje de coordenadas.
Una reflexión con respecto a un eje de coordenadas.
f) Una compresión o expansión a l o largo de un eje de coordenadas seguida de
una reflexión con respectoa un eje de coordenadas.
b)
c)
d)
e)
Solución. Debido a que al realizar una sola operación en los renglones de una
matriz identidad 2 x 2 se obtiene una matriz elemental 2 x 2, ésta debe tener una
de las formas siguientes (comprobar):
9.2 Geometría de los operadores lineales sobreR2 / 527
[-b :] [A
=
-;,I [A
=
-:][A
:,I
Como k , > O, el producto en (3) representa una compresión o expansión a l o largo
del eje x seguida de una reflexión con respecto al eje y, y (4) representa una
compresión o expansión a l o largo del eje y seguida de una reflexión con respecto
al eje x. En el caso en que k = -1, a
ls transformaciones (3) y (4) simplemente son
reflexiones con respecto a los ejes y y x, respectivamente. A
Las reflexiones,rotaciones, expansiones, compresiones y deslizamientos
cortantes son, todas, operadores lineales uno a uno. Este hecho es evidente geométricamente, ya que todosestos operadores mapean puntos distintos en puntos
distintos. Esto también se puede comprobar de manera algebraica al verificar que
las matrices estándar de los operadores son invertibles.
Ejemplo 4 Intuitivamente resulta evidente que si el plano xy se comprime por un
factor en la direccióny , entonces el plano xy se debe expandir por un factor 2 en
la drección y a fin de que cada punto regrese a su posición original. En efecto,
esto es asi porque
i
representa una compresión en la direccióny con factor
es una expansión en la dirección y con factor 2.
PROPIEDADES
GEOMÉTRICAS
i,y
A
Esta secciónconcluye con dos teoremas que permiten conocer más las propiedades
geométricas de los operadores lineales sobre R 2 .
DE LOS
~~~"
OPERADORES
LINEALES
SOBRE R2
Teorema 9.2.1. Si T:R2 + R2 es la multiplicación por una matriz A invertible,
entonces el efecto geométrico de T es el mismo que el de una sucesión idónea
de deslizamientos cortantes,compresiones, expansiones y reflexiones.
528
/'
Temas complementarios
Demostración. Como A es invertible, sepuede reducir a la identidad mediante
una sucesión finita de operaciones elementales en los renglones. Una operación
elemental en los renglones se puede efectuar multiplicando por la izquierda por
una matriz elemental. Así, existen matriz elementales E,, E*, . . . , Ek tales que
EA.
' '
E,EIA
=1
Despejando A se obtiene
o bien, de manera equivalente,
A = E ~ ]-E - 1 . . . E L1
1
2
( 51
Esta ecuación expresa a A como un producto de matrices elementales (ya que por
el teorema 1.5.2 la inversa deuna matriz elemental también es elemental). El
resultado se concluye ahora por el ejemplo 3. 0
Ejemplo 5 Suponiendo que k , y k, son positivos, expresar la matriz diagonal
como un producto de matrices elementales y describir el efecto geométrico de la
multiplicación por A en términos de expansiones y compresiones.
Solución. Por el ejemplo 1 se tiene que
lo cual demuestra que la multiplicación por A tiene el efectogeométrico de
expandir o comprimir por un factor de k , en la dirección x y luego expandir o
comprimir por un factor de k, en la direccióny . A
Ejemplo 6 Expresar
A =
I: :]
como un producto de matrices elementales y luego describir el efecto geométrico
de la multiplicación por A en términos de deslizamientos cortantes, compresiones,
expansiones y reflexiones.
9.2 Geometría de los operadores lineales sobre R2 / 529
Solución. A se puede reducir a I como sigue:
I veces al segundo. I I - 4.
.
.
Las tres operaciones consecutivas en los renglones se pueden efectuar al multiplicar por la izquierda sucesivamente por
Invirtiendo estas matrices y aplicando (5) se obtiene
Leyendo de derecha a izquierda y observandoque
[:-;][:-y][:
=
;]
se concluye que el efecto de multiplicar por A es equivalente a
1) efectuar un deslizamiento cortante por un factor de 2 en la dirección x, luegd
2) expandir por un factor de 2 en la dirección y, luego
3 ) reflejar con respecto al eje x, y finalmente
4) efectuar un deslizamiento cortante por un factor de 3 en la dirección y.
Las demostraciones de algunos incisos del siguiente teorema se analizan en los
ejercicios.
Teorema 9.2.2.S T:R2 + R2 es la multiplicación por una matriz invertible,
entonces:
a ) La imagen de una recta es una recta.
b ) La imagen de una recta que pasa por el origen es una recta que pasa por
el orrgen.
c ) Las imágenes de rectas paralelasson rectas paralelas.
d) La imagen del segmento de recta que une los puntos P y Q es el segmento
de recta que une las imágenes de los puntos P y Q.
e ) Las imágenes de tres puntos están sobre una recta si y sólo si los puntos
son colineales.
530
Temas
complementarios
Por los incisos c), 6)y e) se concluye que la multiplicación por
una matriz invertible A 2 X 2 transforma triángulos en triángulos y paralelogramos en paralelogramos.
OBSERVACI~N.
Ejemplo 7 Trazar la imagen del cuadrado con vértices P,(O, O), P2(l, O), P3(0, 1)
y P4( 1, 1) bajo la multiplicación por
[-:--:I[:] =[:I [ -f .-:I[:] [ -:]
[-i -:][:I [ -:] I
:-:I[ :] [I]
Solución. Como
=
=
=
la imagen del cuadrado es un paralelogramo con vértices (O, O), (- 1, 2), (2, - 1) y
( 1 , 1) (figura 5). A
Ejemplo 8 Según el teorema 9.2.2, la matriz invertible
transforma la recta y = 2x + 1 en otra recta. Encontrar su ecuación.
Solución. Sea (x, y ) un punto sobre la recta y
bajo la multiplicación por A . Entonces
=
2x
+ 1 y sea (x', Y ' ) su imagen
9.2 Geometría de los operadores lineales sobre R2 1 531
de modo que
Sustituyendo en y
= 2x + 1 se obtiene
-2x‘
+ 3y’ = 2(x’ - y ’ ) + I
o bien, de manera equivalente,
Así,
(XI,
y’) satisface
y=$x+i
que es la ecuación buscada.
EJERCICIOS DE LA SECCIóN 9.2
1. Encontrar la matriz estándar para la transformación lineal plana T X 2 + R2 que mapea
un punto (x,y) en (véase la figura 6)
a) su reflexión con respecto a la rectay =-x.
b) su reflexión con respecto al origen.
c) su proyección ortogonal sobreel eje x.
d) su proyección ortogonalsobre el eje y.
4
2. En cada inciso del ejercicio 1, usar la matriz obtenida para calcular T(2, 1). Comprobar
las respuestas geométricamente graficando lospuntos (2, 1) y T(2, 1).
3. Encontrar la matriz estándar para eloperadorlineal
punto (x, y , z) en su reflexión con respecto al plano
a)
-*y
b) x z .
C) YZ.
TB3 + R3 quetransforma un
Figura 6
5317
i'
7ema.y contplernentnrros
1. En cada inciso del ejercicio
3 , usar la matriz obtenida para calcular T( I , 1, I ) .
Comprobar las respuestas geom6tricamentc. graficando los vectores (1 1, 1 ) y T( I ,
1, 1 )
~
5. Encontrar la matriz estándar para el operador lineal 7 X 3 + R3 que
a ) hace girar cada vector 90' en sentido contrario a las manecillas del reloj con respecto al e ~ ze (mirando a lo largo del eje z positivo llacia e1 origen).
b) hace girar cada vector 90' en sentido contrario a las manecillas del reloj con respecto al eje x (mirando a lo largo del eje x positivo hacia el origen).
c) hace girar cada vector 90' en sentido contrario a las manecillas del reloj con res-
pecto al ejev (mirando a lo largo del eje y positivo hacia el origen).
6. Trazar l a iInagen del rectángulo con vértices (O, O), (1, O), (1,2) y (O, 2) bajo
a) una rellexión con respecto al q e x.
b) una reflexión con respecto aleje y.
c) una compresión con factor k =
en la direcclóny.
d) una expansion con factor k = 2 en la dirección x.
e) un deslizamiento cortante con factor k = 3 en la dirección x .
t) un deslizamiento cortante con factor k = 2 en l a direccióny.
a
7. Trazar la imagen dei cuadrado con vértices (O,O),
multiplicación por
A=
(1, O ) , (O, I ) y ( I , 1) bajo la
[ -;y ]
8. Encontrar la matriz que hace girar un punto (x,y) con respecto al origen por un hlgulo
de
a) 45"
b) 90"
C)
180"
d ) 270"
e ) -30"
9. Encontrar la matriz queproduce un deslizamiento cortante con u11 factor de
a) k = 4 en a
l dirección y.
b] k = -2 en la dirección x.
1o. Encontrar l a matnz que comprime o expande con un factor de
a ) f en la dirección y.
b) 6 en la direction x.
11. E n cada inciso, describir el efecto geonlétrico de la multiplicacion por
dada.
l a matriz
como un producto de matriceselementales y luego describir el
12. Expresarlamatriz
efecto de lamultiplicaci6n
por la matriz dadaen
términos de compresiones,
expansiones, reflexlones y deslizamientos cortantes.
13. En cada inciso. encontrar una sola matriz que efectúe la sucesión de operxiones que se
mdica:
9.2 Geometría de los operadores lineales sobre R2 / 533
a) Comprimir por un factor de $ en la dirección x, luego expandir por un factor de 5
en ladirección y.
b) Expandir por un factor de 5 en la dirección y, luego efectuar un deslizamiento cortante por un factor de 2 en la direccióny.
c) Reflejar con respecto a y = x, luego girar por un ángulo de 180'.
14. En cada inciso, encontrar una sola m
a
& que efectúe la sucesión de operaciones que se
indica:
a) Reflejar con respecto al eje y, luego expandir por un factor de 5 en la dirección x y
luego reflejar con respectoa y = x.
b) Girar 30°, luegoefectuar un deslizamientocortante por un factor de -2 enla
dirección y y luego expandir por un factor de 3 en la dirección y.
15. Por inversión de matnces, demostrar lo siguiente:
a) La transformación inversa de una reflexión con respecto a y = x es una reflexión
con respecto a y = x.
b) La transformación inversa de una compresión a lo largo de uno de los ejes de coordenadas es una expansión a l o largo de ese eje.
c) La transformación inversa de una reflexión con respecto a uno de los ejes de coordenadas es una reflexión con respecto a ese eje.
d) La transformación inversa de un deslizamiento cortante a l o largo de uno de los ejes
de coordenadas es un deslizamiento cortante a lo largo de ese eje.
16. Encontrar la ecuación de la imagen de la rectay = -4x
+ 3 bajo la multiplicación por
17. En los incisos del a) ale), obtener la ecuación de la imagen de la rectay = 2x bajo
a) un deslizamiento cortante con factor 3 en la dirección x.
b) una compresión con factor $ en la dirección y.
c) una reflexión con respecto a y = x.
d) una reflexión con respecto al ejey.
e) una rotación de 60°.
18. Encontrar la matnz para un deslizamiento cortante en la dirección x que transforma el
triángulo con vértices (O, O), (2, 1) y ( 3 , O) en un triángulo rectángulo cuyo ángulo recto
está en el origen.
19. a) Demostrar que la multiplicación por
transforma cada punto del plano sobre larectay = 2x.
b) Con base en el inciso a) se concluye que los puntos no colmeales (1, O), (O, 1) y ( - 1, O)
se transforman en una recta. ¿Este hecho viola el inciso 2) del teorema 9.2.2'?
20. Demostrar el inciso a) del teorema 9.2.2. [Sugerencia Una recta en el plano tiene uná
ecuac~ón dela forma Ax + By + C = O, donde tanto A como B no son cero. Con el
534 i Temas complementarios
método del ejempio 8, demostrar que la imagen de esta recta bajo la multiplicación por
la matriz invertible
tiene la ecuación A'x + By + C = O, donde
A' = (dA - c B ) / ( ~ d bc)
y
B' = ( - bA
+ u B ) / ( u -~ bc)
Luego, demostrar que ni A' ni B son cero afin de concluir que la imagen es una recta,]
21. Usando la sugerencia del ejercicio 20, demostrar los incisos b ) y c ) del teorema 9.2.2.
22. En cada inciso, encontrar la matriz estándar para el operador lineal í?A3 + R3 descrito
por la figura 7.
c
4
4
d
b)
Figura 7
23. En R3, el deslizamiento cortanfe en la a'ireccibn xy con factor k es la transformación
lineal que mueve cada punto (x,y , z) paralelo al plano xy a la nueva posición (x + kz, y
+ kz, z). (Véase la figura 8.)
a) Encontrar la matriz estándar del deslizamiento cortanteen la dxecciónxy con factork.
b) ¿Cómo d e f d a el lector el deslizamiento cortante en la dirección xz con factor k y
el deslizamiento cortante en la dirección yz con factor k? Encontrar la matriz
est&dar para cada una de estas transformaciones lineales.
. ..
".
~.
~
."
t;
1
4.
. ."
"'ir + k z , y + kz. )I
.
.
.
,'
"
.~
",."
Figura 8
24. En cada inciso, encontrar por inspección todos los eigenvectores linealmente independientes que sea posible (mediante una representación del efecto geométrico de la
transformación sobre R'). Para cada uno de los eigenvectores, encontrar por inspección
el eigenvalor correspondiente; luego comprobar los resultados calculando los eigenvaiores y bases para los eigenespacios partir de la matriz estándar de la transformación.
9.3 Ajuste de datos por mínimos cuadrados
I’
535
Reflexión con respecto al eje x.
Reflexión con respecto al eje y.
Reflexión con respecto a y = x.
Deslizamiento cortante en la direcciónx con factor k.
Deslizamiento cortante en la direccióny con factor k.
f) Rotación por un ángulo O.
a)
b)
c)
d)
e)
9.3 AJUSTE DE DATOS POR MíNIMOS CUADRADOS
En esta sección se usarán resultados sobre proyecciones ortogonales en espacios
vectoriales con producto interior a fin de obtener una técnica para ajustar una
recta u otra curva polinómica a un conjunto de puntos en el plano determinados
experimentalmente.
AJUSTE DE UNA
CURVA A DATOS
EXPERIMENTALES
Un problema común en el trabajo experimental es obtener una relación matemátic a y = f i x ) entre dos variables x y y mediante el “ajuste” de una curva a puntos en
el plano correspondientes a diversos valores de x y y determinados experimentalmente,
ejemplo
por
(~I,~~I),(-y2,Y2),”‘,(~,,Y,)
La forma general de la curva y =Ax) que se debe ajustar se decide con base
en consideraciones teóricas o simplemente en el patrón descrito por los puntos.
Algunas posibilidades son (figura 1)
4
Figura 1
y=a+bx
b)
y =a
+ bx + cx2
c)
y =a
+ bx + cx2 + dx’
a) Una recta: y = a + bx.
b) Un polinomio cuaddtico: y = a + bx + cx2.
c) Un polinomio cúbico: y = a + bx + cx2 + &.
Debido a que los puntos se obtienen experimentalmente, suele haber algún “error”
de medición en los datos, lo cual imposibilita encontrar una curva de la forma
deseada que pase por todos los puntos. Así, la idea es elegir la curva (determi-
536
Temas
complementarios
nando sus coeficientes) que mejor se "ajuste" a los datos. Se empezará con el caso
más simple: ajustar una recta a los puntos de datos.
AJUSTE POR
MÍNIMOS CUADRADOS DE
UNA RECTA
Supóngase que se quiere ajustar una recta
y=a+bx
a los puntos determinados experimentalmente
Si los puntos de datos son colineales, la recta debe pasar por todos los n puntos y,
así, los coeficientes desconocidos a y b deben satisfacer
y, = a + bx,
y, = a
+ bx2
y,, = a + bx,,
Este sistema se puede escribir en forma matricial como
o, en forma abreviada, como
Mv=y
donde
Si los puntos de datos no son colineales, entonces es imposible encontrar los
coeficientes a y b que satisfagan exactamente el sistema (1); es decir, el sistema es
inconsistente. En este caso se buscará una solución por mínimos cuadrados
v
= v* =
[;:I
La recta y = a* + b*x cuyos coeficientes provienen de una solución por mínimos
cuadrados se denomina recta de ajuste por mínimos cuadrados a los datos. Para
9.3 Ajuste de datos pormínimos cuadrados / 537
explicar esta terminología, recuérdese que una solución por mínimos cuadrados de
(1) minimiza
IIY
-
Mvll
(3 )
Si el cuadrado de (3) se expresa en términos de componentes, se obtiene
IIy -MV(/'
= ( y , - a - bx,)'
+ ( y z- a
- bx212 + . . .
+ ( y , - a - bx,12
(4)
Si ahora se hace
d , = I,v
-U
-
~ x Jd2
, =
-U
- hx-21,
. . . , d,, = ly,, - a - h ~ , /
entonces (4) se puede escribir como
1Iy - Mvll'
= d:
+ d: + . . . -td:
(5)
Como se ilustra en la figura 2, di se puede interpretar como la distancia vertical
entre la recta y = a + bx y el punto (xi,vi).Esta distancia es una medda del
"error" en el punto (xi,y j ) , que resulta del ajuste inexacto de y = a + bx a datos.
Como (3) y (5) son minimizadas por el mismo vector v*, la recta deajustepor
mínimos cuadrados minimiza la suma de los cuadrados de estos errores; de ahí la
denominación recta de ajuste por mínimos cuadrados.
I d, mide el error vertical en el ajuste de l a recta por mínimos cuadrados.
~
Figura 2
ECUACIONES
NORMALES
~~
Recuérdese por el teorema 6.4.2 que las soluciones por mínimos cuadrados de (1)
se pueden obtener al resolverel sistema normal asociado
M TMv= M T y
cuyas ecuaciones se denominan ecuaciones normales.
En los ejercicios se demostrará que los vectores columna de M son linealmente independientes si y sólo si los n puntos de datos no están en unarecta
vertical en el plano xy. En este caso, por el teorema 6.4.4 se concluye que la
solución por mínimos cuadrados es única y está dada por
,
538 / Temas complementarios
v*
= ( M T M ) - "Ty
En resumen, se tiene el siguiente teorema.
Teorema 9.3.1. Sean (xl, y l ) , (x2, y& . . . , (x,, y,) puntos de u1 conjunto de
dos o más datos, no todos en unarecta vertical, y sean
Entonces existe una recta de ajuste por mínimos cuadrados tinica
y = a*
+ b*x
al conjunto de datos. Además,
está dejinidapor la fórmula
que expresa el hecho de que v
normales
=
v* es la única solución de las ecuaciones
Ejemplo 1 Encontrar la recta de ajuste por mínimos cuadrados a los cuatro puntos
( O , l), (1, 3), (2, 4) y (3,4). (Véase la figura 3.)
0:
Figura 3
~
-
- 1 0
1
2
X
3
4
9.3 Ajuste de datos por mínimos cuadrados / 539
Solución. Se tiene
M T M = [4
6
'1
14
rll
L41
De modo que la recta buscada es y
=
l .5 + x. A
Ejemplo 2 La ley de Hooke en física establece que la longitud x de un resorte
uniforme es una función lineal de la fuerza y que se le aplica al resorte. Si se
escribe y = a + bx, entonces el coeficiente b se denomina constante del resor6.1 pulgadas de lonte. Supóngase que un resorte particular sin estirar mide
gitud (es decir, x = 6.1 cuando y = 0). Luego, al resorte se aplican fuerzas de
2, 4 y 6 libras, encontrándose que las longitudes correspondientes son 7.6, 8.7
y 10.4 pulgadas, respectivamente, (ver la figura 4). Encontrar la constante de
este resorte.
x,
Figura 4
+
Fuerzay
I
6.1
I
7.6
8.7
10.4
540 i Temas complementarios
Solución. Se tiene
10.4
Y
donde los valores numéricos se redondearon hasta una cifra decimal. Así, el valor
estimado de la constante del resorte es b* = 1.4 Ib/pulg. A
AJUSTE POR
MINIMOS
CUADRADOS DE
UN POLINOMIO
La técnica descrita para ajustar una recta a puntos de datos se generaliza fácilmente al ajuste de un polinomio de cualquier grado específico a puntos dedatos.
A continuación se intentará ajustar un polinomio de grado fijo m
y = a,
+ a,x+ . . . + a,xm
a n puntos
Al sustituir los n valores de x y y en (8) se obtienen las n ecuaciones
o bien, en forma matricial,
Mv=y
donde
Como antes, las soluciones de las ecuaciones normales
(8)
9.3 Ajuste de datos por mínimos cuadrados 1 541
M TMv = M Ty
determinan los coeficientes de los polinomios que minimizan
IIY - Mvll
En los ejercicios se analizan condiciones que garantizan la invertibilidad de MTM.
Si MTM es invertible, entonces las ecuaciones normales tienen una solución única
v = v* definida por
v*
= ( M T M ) - 1MTy
Ejemplo 3 Según la segunda ley del movimiento de Newton, un cuerpo próximo a
la superficie terrestre cae verticalmente según la ecuación
s=s,+u,t+~gt*
(10)
donde
S
so
vo
g
= Desplazamiento vertical hacia abajo con respecto a algún punto fijo.
= Desplazamiento inicial en el instante t = O.
= Velocidad inicial en el instante t = O.
= Aceleración de la gravedad en la superficie terrestre.
Supóngase que se efectúa un experimento de laboratorio para evaluar g usando la
ecuación anterior. Se suelta unpesocon
desplazamiento y velocidad iniciales
desconocidos, y en ciertos instantes se mide la distancia recorrida a partir de algún
punto de referencia fijo. En particular, supóngase que en los instantes t = O. 1, 0.2,
0.3, 0.4 y 0.5 segundos se encuentra que el peso ha recorrido S = -0.18, 0.31,
1.03. 2.48 y 3.73 pies, respectivamente, a partir del punto de referencia. Encontrar
un valor aproximado de g usando estos datos.
Solución. El problema matemático es ajustar una curva cuadrática
S
= a,
+ a,t + a2t2
a los cinco puntos experimentales:
(0.1, -0.18), (0.2, 0.31), (0.3, 1.03), (0.4, 2.48), (0.5, 3.73)
Los cálculos necesarios son
1 t,
M=
t;
1 t2 t;
1 t3 t:
1 t, t i
1 t5 t:
(1 1)
542
1
Temas complementarios
-0.18
2.48
3.73
Y
=(MTM)
V* =
~
' M T y"-
[
0.400.35
16.1
-
Por (10) y (1 1) se tiene a2 = +a, de modo que el valor estimado de g es
g = 2a: = 2(16.1)
= 32.2
pies/s2
Si se desea, también es posible estimar el desplazamiento y la velocidad iniciales
del peso:
so = a: = -0.40 pies
u. = a: =
0.35 piesls
En la figura 5 se muestra la gráfka los cinco puntos experimentales, asi como el
polinomio de aproximación.
-1
Figura 5
0
1 2 . 3 4 . 5
Tiempo /(en segundos)
EJERCICIOS DE LA SECCIÓN 9.3
6
9.4 Problemas de aproximación: series de Fourier / 543
3. Encontrar el polinomio cuadrático que se ajusta mejor a los puntos (2, O), (3,
- 1 lo),
(5, -48) y (6, -76).
4. Encontrar el polinomio cúbico que se ajusta mejor a los puntos (- 1,
(1 > -4), (2, 1) Y (3,221.
- 14), (O,
-S),
Demostrar que la matriz M en la ecuación (2) tiene columnas linealmente
independientes si y sólo si porlomenosdos
de los números xl, x2, . . . , xn son
distintos.
Demostrar que las columnasde la matriz Mn x (m + 1)enlaecuación
(9) son
linealmente independientes si n > m y por lo menos m + 1 de los números x , , x2, . . . ,
x,, son distintos.
SeaM la matriz de la ecuación (9). Usando el ejercicio 6, demostrar que una condición
suficiente para que la matriz MM sea invertible es que n > m y por l o menos m + 1 de
los númerosx ] ,x2, . . . ,xn sean distintos.
El propietano de unaempresaenrápidocrecimiento
encuentra que para los cinco
primeros meses del año las ventas (en miles) son $4.0, $4.4, $5.2, $6.4 y $8.0. El
propietario grafica estas cifras y conjetura que para el resto del año la curva de ventas
puede ser aproximada por un polinomio cuadrático. Encontrar el polinomio cuadrático
de ajuste por mínimos cuadrados ala curva de ventasy usarlo para proyectar las ventas
de los doce meses del año.
9.4 PROBLEMAS DE APROXIMACIóN: SERIES DE FOURIER
En esta sección se usarán los resultados de proyecciones ortogonales en espacios
con producto interior para resolver problemas que requieren la aproximación de
una función dada por funciones más simples. Estos problemas surgen en una
variedad de aplicaciones de ingenieria y ciencias.
MEJORES
APROXIMASIONES
Todos los problemas que se estudiarán en esta sección son casos especialesdel
siguiente
problema
general.
I
I
Problema de aproximación. Dada una función f que es continua sobre un
posible" a f usando sólo
intervalo [a, 61, encontrar la "mejor aproximación
funciones de unsubespacio específico W de C[a,61.
A continuación se presentan algunos ejemplos deesos problemas:
a) Encontrar la mejor aproximación posible a eX sobre [O, 11 por un polinomi0 de
la formaa. + a l x + a g 2 .
544 / Temas complementarios
b) Encontrar la mejor aproximación posible a sen nx sobre [ - 1, 1I por una fun+ u3e3.‘.
ciónde la forma u. + ulc? +
c> Encontrar la mejor aproximación posible a x sobre [O, 2x1 por una función de
la forma clo + u , sen x + a2 sen 2x + h, cos x + 6, cos 2x.
En el primer ejemplo, W es el subespacio de C[O, 11 generado por 1, x y x;, en el
segundo ejemplo, W es el subespacio de C[- 1, 11 generado por 1, @, e& y e3x; y
en el tercer ejemplo, U’ es el subespacio de C[O, 2n] generado por 1, sen x, sen 2x,
cos x y cos 2x
MEDICIONES
DEL ERROR
Para resolver problemas de aproximación de los tipos precedentes es necesario
precisar matemáticamente la expresión “mejor aproximación sobre [u, b]”; para
este efecto se requiere una manera exacta de medir el error que resulta cuando una
función continua es aproximada por otra sobre [a. 61. Si sólo se quisiera la aproximación de,flx) en un simple punto xo, entonces el error en x. por una aproximación g(x) sería simplemente
error =Axo) - g(xo)
que algunas veces se denomina desviación entre f y g en x. (figura 1). Sin
embargo, se quiere la aproximación sobre todo el intervalo [u, b], no en un solo
punto. En consecuencia, en una parte del intervalo una aproximación g, afpuede
tener desviaciones más pequeñas con respecto a f que una aproximación g, a f ; y
en otra parte del intervalo bien puede ser al contrario. ¿Cómo decidir cuál es la
mejor aproximación global? Lo que se requiere es alguna forma para medir el
error global en una aproximación g(x). Una posible medida del error global se
obtiene integrando la desviación Axo) - g(xo) sobre todo el intervalo [a, b]; es
decir,
error =
Figura 1
Desviación entref y g en X O .
l
(f(x)- g(x)( dx
9.4 Problemas de aproximación: series de Fourier i 545
Geométricamente, (1) es al área entre las gráficas def(x) y g(x) sobre el intervalo
[a,b] (figura 2); mientras mayor sea el área, mayor es el error global.
El área entre las gráficas d e f y g sobre [u, b ]
mide el error al aproximarfpor g sobre [a,b ] .
Si bien la expresión (1) es natural y geométricamente atractiva, casi todos
los matemáticos y científícos suelen inclinarse por la otra medida del error,
denominada error cuadrriticomedio.
I
I
error cuadráticomedio
I
I
El error cuadrático medio recalca el efecto de errores mayoresdebido a la
elevación al cuadrado y posee la ventaja adicional de permitir aplicar la teoría de
los espacios con producto interior. A fin de ver cómo es posible llevar a cabo lo
anterior, supóngase que f es una función continua sobre [a, b] que se desea
aproximar por una función g de un subespacio Wde C[a,b ] ,y supóngase que en C
[a,b] se define el producto interior
J'
h
(f,
8) =
f(xlg(x) dx
Se concluye que
Ilf
- 81)' = ( f - g, f
-
g) =
[ f(x) - g(x)I2 dx = 'error cuadrático medio
de modo que minimizar el error cuadrático medio es l o mismo que minimizar
llf - g1I2. Así, el problema de aproximación planteado informalmente al ihicio de
esta sección se puede volvera plantear más precisamente como sigue:
APROXIMACI~
IN
POR MÍNIMOS
CUADRADOS
Problema de aproximaciónpor mínimos cuadrados. Sea f una función que
es continua sobre un intervalo [a,b ] ,sea C[a,b] con el producto interior
y sca Lt' un subespacio de dimensión finita de C[a, b]. Encontrar una función g
em CV que minimice
i
Como Ilf -- gl12 y I(f - gl( son minimizados por la misma función g, el problema
precedente equivale a buscar una función g en W que sea la más próxima a f. Pero
por el teorema 6.4.1 se sabe que g = proywf es la función (figura 3).
Así. se tiene el siguiente resultado.
~
~
~~~
~~~
~
~
~
Solución del problema de aproximación por mínimos cuadrados. Si f es una
función continua sobre [u, b ] y W es un subespacio de dimensión finita de C[u,
bl, entonces la función g en W que minimiza el error cuadrático medio
es g = proym: f. donde l a proyección ortogonal es conrespecto al producto
interior
La función g = proypvf se denomina aproximación por minimos cuadrados a f
desde W.
Una función de la forma
t(X)
+ C'2 cos 2x + . + c, cos nx
+ d , senx + d , sen2x + . . + d , sennx
= co t
L',
cos x
' '
se denomina polinomio trigonométrico; si c, y
que [(x) es de orden n . Por ejemplo.
[(x) = 2
+ cos x
~
(2)
u
,'no son cero, entonces se dice
3 cos 2x
+ 7sen4s
9.4 Problemas de aproximación: series de Fourier
1
547
es un polinornio trigonométrico con
El orden de t(x) es 4.
Por (2) resulta evidente que los polinomios trigonomktricos de orden mcnor
o igual que n son las diversas combinaciones lineales posibles de
. . . , cos nx, senx,sen2x,
1, cos x, cos 2x,
. . . , sennx
13)
Se puede demostrar que estas 2n + 1 funciones son linealmente independicnles y
que en consecuencia para cualquier intervalo [ a , b ] forman una base para
subespacio de dimensión (2n + 1) de C[a, 61.
A continuación se considerará el problema deencontrar la aproximación por
mínimos cuadrados de una función continuaflx) sobre el intervalo [O, 2 z I por u11
polinomio trigonométrico de orden menor o igual que n. Como ya se mencionó, Ea
aproximación por minimos cuadrados a f desde W es la proyección artogonal dc T
sobre W. Para encontrar esta proyección ortogonal es necesario delerminar m a
base ortonormal g o , g,, . . . , k,,para W, después de lo cual es posible calculan I n
proyección ortogonal sobre W a partir de la fórmula
[vease el teorema 6.3.5). Es posible obtener una base ortonormal para kt/ medianhe
la aplicación del proceso de Gram-Schmidt a la base (31, usando el producto interior
Así se obtiene (ejercicio 6) la base ortonormal
1
m'
1
go = - g, = -cos x,
g,,
,=
Si se introduce la notación
VG
1
1
. . . , g, = __ cos nx,
G
1
senx, . . . , g2, = __ sennx
6
5411
,/
lemas complementarios
entonces al sustituir ( 5 ) en (4) se obtiene
a0
projcvf = ;
+[ u , cos x
+ . . . + u,?cos nx] + [ h ,senx + . . . +- h, sennx]
.
L
donde
En resumen.
Los nimeros
de f.
ao, a19,
. , , a,,,b,, . . . , b,, se denominan coeficientes de Fourier*
Ejemplo 1 Encontrar la aproximación por mínimos cuadrados de Ax)
[O, 2 nl por
= x
sobre
a) un polinomio trigonométrico de orden menor o g
iu
a
lque 2;
b) un polinomio trigonométrico de orden menor o g
iu
a
lque n.
*Jean Soptiste Joseph Fourier (1768-1830) fue un matemático y fisico francés que descubrióa
ls series
que llevan su nombre e ideas relacionadas cuando trabajaba en problemas de difksión del calor. Este
descubrimiento es uno de los más importantes en la historia de l a s matemáticas; es la piedra angular de
muchos campos de investigación matemática y una herramienta básica en muchas ramas de la ingeniería.
Fourier, un activista político durante la revolución francesa, fue encarcelado por haber defendido a muchas
victimas durante la Epoca del Terror. Después se convirtió en favorito de Napoleón, quien l o nombró barón
y conde.
9.4 Problemas de aproximación: series de Fourier / S49
Solución de a).
Para k = 1,2, . . . al integrar por partes se obtiene (comprobar)
2rr
Así, la aproximación por mínimos cuadrados a x en [O, 23t] por un polinomio
trigonométrico de orden menor o igual que 2 es
a
x--"o + a , cos x + a 2 cos 2x + b , senx + b2sen 2x
2
o bien, por (7a), (7b) y (7c),
x=
7r -
2 senx - sen2x
Solución de b). La aproximación por mínimos cuadrados a x en [O. 2n] por un
polinomio trigonométrico de orden menor o igual que n es
U
x=O
2
+ [ a ,cos x + . . . + a, cos nx] -t [b, sinx + . . . + b,
o bien, por (7a), (7b) y (7c),
+-
3
n - 2 (sen X
sen nx
+...+"--n
+
(sen X +
T -
2
"
2 (sen X
n - 2 sen X
4
sennx]
Es natural esperar que disminuya el error cuadrático medio a medida que
aumenta el número de términos en la aproximación por mínimos cuadrados
u
fQ
2
+ 2 íuk cos kx + b, sen kx)
k=l
Es posible demostrar que para funciones f en C[O, n] el error cuadrático medio
tiende a cero cuando n -+ + m ; este hecho se denota con
7-
f(x) =
U
2
i-
(uk
cos
kx + bksenkx)
k-l
El miembro derecho de esta ecuación se denomina serie de Fourier parafsobre el
intervalo C[O, f r ] . Estas series son importantes en ingenieria, ciencias y matemáticas. A
DE LA SlECCIibN 9.4
a . Encontrar la aprcxirnacibn por mínimos cuadrados deAx) = 1 + x sobre el intervalo [O,
Z.X]
por
a;) un polinemio trigonomktrico de orden menor o igual que 2.
b) un pclinomio trigonomttrico de orden menor o igual que n.
2. ihconlrar ? a aproximacián por minimos cuadrados deflx) = x2 sobre el intervalo
io, 2x1 por
a) un polinomio trigonomktricode orden menor o igual que 3.
tm p d i n o m i ~trigonomktrico de orden menor o igual que ?J.
;:)
3.
Encorttrar la aproximación por mínimos cuadrados de x sobre el intervalo [O, I ] por
m a fimcibn de la forma a + b 2 .
iincontr-arcl error cnadrático medio de la aproximación.
3)
G ,;
4. a ) finzontrar la aproximación por
mínimos cuadrados de di sobre el intervalo [O, 11
por un polinomio de la forma a. + a,x.
h)Encontrar el error cuadrático medio de la aproximación.
J.
:*) I:ncc;nhar la aproximación por mínimos cuadrados de sen z x sobre el intervalo [
i I w, un gollllornio da: la forma u. + u , x + u$.
b ) ~ ~ n m ~ t .elr aerror
r cuadrático medio de la aproximación.
L
:.;.,
- 1,
L
ia/i,cdi¿mtcel proceso de Gram-Schmidt, obtener la base ortonomal(5) a partir de la
¡;;!.;c. ( 3 ) .
9.5 Formas cuadrát~cas 5.51
7. Efectuar las integraciones en (7a), (7b) y (7c).
8. Encontrar la serie de Fourier deAx) = ~t - x sobre el intervalo [O, 2x1
9.5 FORMAS CUADRÁTICAS
Hasta el momento en este texto se ha hecho énfasis en
decir, ecuaciones de la.forma
/as e c r t ~ ~ i o nlinedes:
e.~
es
El miembro izquierdo de esta ecuación,
es una función de n variables, denominada forma lineal. En una,f¿)rmaírneul Ius
variables están elevadas a la primera
potencra y en la expresicin no hay producfos
de variables. En esta seccicin se estudiarán funciones en las que los tirrnrnos .\(IF?
cuadrados de variables o productos de dos variables. Estasfuncrones apnrcvn en
una gama de aplicaciones, incluyendo geometría, vibraciones de srstemas vwchnicos, estadística e ingeniería eléctrica.
I
FORMAS
CUADRÁTICAS
CON DOS
VAKIABLES
Una forma cuadrática con dos variables, x y y , sedefinecomouna
se
puede escribir como
uxz
cxprcs~5nque
+ 2hXj. + cy*
(1;
Ejemplo 1 Las siguientes expresiones son formas cuadráticas en x y
Si se acuerda suprimir los corchetes en las matrices de I
se puede escribir en forma matricial como
X
,
y
l . entonces ( I )
(Comprobar multiplicando las matrices.) Nótese que la matriz 2 X 2 en (2) es
simétrica, que los elementos en la diagonal son los coeficientes dc los ttrrnlnor, :d
cuadrado y que cada uno de los elementos fuera de la diagonal principal es a
i
mitad de coeficiente deltérmino del producto x y .
S52
1
Temas complementarios
Ejemplo 2
2x2
FORMAS
CUADRÁTICAS
CON n
VARIABLES
+ ~ X J -J 7v2= [X
[: -:][;I
y]
Lasformascuadráticas nose limitan a dosvariables. A continuaciónsedefineuna
forma
cuadratica
general.
Definicibn.Unaforma cuadrritica con las n variables xl, x2, . . . , x,, es una
expresión que se puede escribir como
I dondeA es una matriz simétrica den X n.
Si se hace
entonces (3) se puede escribir de manera más abreviada como
x TAx
(4)
Además, es posible demostrar que si las matrices en (4) se multiplican, la expresión resultante es dela forma
donde
denota la suma de los términos de la formaa l p . ,donde xi y xj son variables &ferentes. Los términos a$zc, denotan términos de producto cruzado de la forma
cuadrática.
9.5 Formas cuadráticas / 553
Las matrices simétricas son útiles, aunque no esenciales, para representar
formas cuadráticas en notación matricial. Así, para la forma cuadrática 2x2 +
6xy - 7 3 del ejemplo 2, el coeficiente del término de producto cruzado se podría
separar en 5 + 1 o 4 + 2 y escribir
O
Sin embargo, las matrices simétricas producen en general los resultados más
simples, de modo que siempre se usarán. Así, cuando una forma cuadrática se
denote por xTAx se entenderá que A es simétrica, aun cuando no se especifique.
OBSERVACI~N. Si se usa el hecho de que A es simétrica; es decir, A = AT, entonces (4) se puede expresar en términos delproducto interior euclilano mediante
xTAx = xT(Ax) = ( A x , x) = (x, A x )
Ejemplo 3 La siguiente expresión es una forma cuadrática en xl, x2 y x3:
x:
+ 7x:
-
3x:
+ 4x,x2 - 2x,x3 + 6x,x,
= [x,
x2 x3]
Nótese que los coeficientes de los términos al cuadrado aparecen sobre la diagonal
principal de la matriz 3 X 3, y que cada uno de los coeficientes de los términos de
producto cruzado están separados a la mitad y aparecen en las posiciones fuera
de la diagonal como sigue:
t
:
:
Coeficiente de A
Posiciones en la matriz A
a12 y a21
XlX3
PROBLEMAS EN
QUEAPARECEN
FORMAS CUADRÁTICAS
'13
y '31
'23
Y
'72
El estudio de formas cuadráticas es un tema extenso que sólo se puede mencionar
en esta sección. A continuación se presentan algunos problemas matemáticos
importantes relacionados con las formas cuadráticas.
554
Temas complementarios
Encontrar los valores máximo y mínimo de la forma cuadrática X'AX si x
está restringido de modo que
¿Qué condiciones debe satisfacer A para que una forma cuadrática cumpla
la desigualdad xTAx > O para todo x f O?
Si xTAx es una forma cuadrática con dos o tres variables y c es una
constante, ¿qué perfil tiene la gráfica de la ecuación xTAx = c?
Si P es una matriz ortogonal, el cambio de variable x = Py convierte la
)
Pero P'AP es una matnz
forma cuadrática xTAx en ( P Y ) ~ A ( P=~y'(PTAP)y.
simétrica si A lo es, de modo queyr(P'AP)y es una nueva forma cuadrática con
las variables de y . Es importante saber si P se puede elegir de modo que esta
nueva forma cuadrática no contenga términos de producto
cruzado.
En esta sección se estudiarán los dos primeros problemas, y en las secciones
siguientes se estudiarán los dos últimos. El siguiente teorema proporciona una
solución al primer problema. Ea demostración se pospone hasta el final de la
sección.
Teorema 9.5.1. Sea A una matriz simétrica n x n cuyos eigenvalores en orden
decreciente son A , IA2 2 . . 2 An. Si x se restringe de modo que llxll = 1 con
respecto al producto interior euclidiano sobre R", entonces:
a)
A, 2 X ~ A X2 A,.
b ) xTAx = A,, si x es un eigenvector de A correspondiente a An y xTAx = 1, si x
es un eigenvector de A correspondiente a A,.
Por este teorema se concluye que sujeta a la restricción
( ( X I /= (x:
+x;
+ ... +x
y=1
,I,
la forma cuadrática xTAx tiene un valor máximo de (el eigenvalor más grande)
y un valor mínimo de I n (el eigenvalor más pequeño).
Ejemplo 4 Encontrar los valores máximo y mínimo de la forma cuadrática
x: 4-x;
+ 4x,x,
.Y:
sujeta a la restricción T x; = 1, y determinar los valores de x1 y
ocurren el máximo y el mínimo.
Solución. La forma cuadrática se puede escribir como
x: + x i
+ 4x,x2 = X'AX
La ecuación característica de A es
= [x,
xz
en que
I
9.5 Formas cuadráticas 1 555
det( dZ - A ) = det [A,,
=d2”d-3=(d-3)(d+
A2:1]
1)=0
Así, los eigenvalores de A son L = 3 y L = - 1, que son los valores máximo y
mínimo, respectivamente, de la forma cuadrática sujeta a la restricción. Para encontrar los valores de x1 y x2 en que ocurren estos valores extremos es necesario
encontrar los eigenvectores correspondientes a estos eigenvalores y luego normalizarlos para satisfacer la condición x: t = 1.
Se deja al lector demostrar que dos bases para los eigenespacios son
<
Normalizando cada uno de estos eigenvectores se obtiene
Así, sujeto a la restricción x:
= 3,
+
<
= 1, el valor máximo de la forma cuadrática es A
que ocurre si x1 = I/J z , x2 = 1/ J z , y el valor minim0 es
=
- 1, que ocurre
si x1 = l/&, x2 = - l/&. Además, se puede obtener otras bases para los
eigenespacios al multiplicar por -1 los vectores básicos anteriores. Así, el valor
máximo, A = 3, también ocurre si x1 = - 1/&,
L = -1, también ocurre si x1 = - 1/&,
MATRICES
POSITIVAS
DEFINIDAS Y
FORMAS
CUADRÁTICAS
xz =
x2 = l/&.
-l/fi
y el valor mínimo,
A
Definicih. Una forma cuadrática xTAx se denomina positiva definida si x*Ax >
O para todo x f O, y una matriz simétrica A se denomina matriz positiva
definida si xTAx es una forma cuadrática positiva definida.
El siguiente teorema es el resultado principal sobre matrices positivas definidas.
Teorema 9.5.2. Una matriz simétrica A es positiva definida si y sólo si los
eigenvalores de A son positivos.
Demostración. Supóngase que A es positiva definida y sea A cualquier
eigenvalor de A . Si x es un eigenvector de A corresponhente a A, entonces x f O y
A x =Ax, de modo que
o < X ~ A X= x r a x = axrx
= a11x112
(6)
donde llxll es la norma euclidiana de x. Como llx112 > O, se deduce que L > O, qui es
lo que se quería demostrar.
556
/'
Temas complementarios
Recíprocamente, supóngase que los eigenvalores de A son positivos. Se debe
demostrar que xTAx > O para todo x f O . Pero si x f O , es posible normalizar x
para obtener el vector y = x/llxll con la propiedad de que llylj = 1. Ahora, por el
teorema 9.5.1 se concluye que
donde I n es elmenor eigenvalor de A . Así,
Multiplicando por lx112 se obtiene
xTAx > O
que es lo que se quería demostrar. U
Ejemplo 5 En el ejemplo 1 de la sección 7.3 se demostró que la matriz simétrica
El siguiente objetivo es proporcionar un criterio que se pueda usar para
determinar si una matriz simétrica es positiva definida sin necesidad de encontrar
sus eigenvalores. Para esto será de utilidad introducir algo de terminología. Si
all
A=
[a;l
an,
"2
".
".
an2
...
a12
::j
ann
es una matriz cuadrada, entonces las subm&¿ces principales de A son las
submatrices formadas a partir de los r primeros renglones y de las r primeras
columnas de A para r = 1,2, . . . , n. Estas submatrices son
r-
1
9.5 Formas cuadráticas / 557
Teorema 9.5.3. Una matriz simétrica A es positiva definida si y sólo si el
determinante de toda submatriz principal es positivo.
Se omite la demostración.
Ejemplo 6 La matriz
es positiva definida, ya que
2
121=2,
-
;I
2
=3,
-1
-3
-1
2
4 =I
-3
4
9
todos son positivos. Así, se garantiza que los eigenvalores de A son positivos y que
xTAx > O para todo x # O . A
OBSERVACI~N.
Una matriz simétrica A y la forma cuadrática xTAx se deno-
minan
positiva semidefinida
negativa dejinida
negativa semidefinida
indefinida
si xTAx 2 O para todo x.
si xTAx < O para x # O .
si xTAx 5 O para todo x.
si xTAx tiene valores tanto positivos
como
negativos.
Los teoremas 9.5.2 y 9.5.3 se pueden modificar de manera evidente a fin de que
sean válidos para los tres primeros tipos de matrices. Por ejemplo, una matriz simétrica A es positiva semidefinida si y sólo si todos sus eigenvalores son no negativos. También, A es positiva semidefinida si y sólo si todas sus submatrices
principales tienen determinantes no negativos.
OPCIONAL
Demostración del teorema 9.5.la.Como A es simétrica, por el teorema 7.3.1 se
concluye que existe una base ortonormal para R" que consta de eigenvectores de A .
558
;'
Temas complementarlos
Supóngase que S' = { vl, v2, . . . , v,,) es esa base, donde vl es el eigenvector
correspondiente al eigenvalor A,. Si ( , } denota el producto interior euclidiano,
entonces por el teorema6.3.1 se concluye que para cualquier x en R"
x = (x, V l > V l
+ (x, v2)v2+
' ' '
+ (x, v,)v,
Por tanto,
A x = (x, VI)AV,
+ (x,v2)Av2+ . . . + (x, v,)Av,
v,)d.,v, + . . . + (x, v,)d,v,
+
v2)v2+ . . . + a,(x, v,)v,
= (x, V I ) h l V ~+(x,
=
al(x,
Se concluye que los vectores de coordenadas para x y A x con respecto a la base S
son
(4s
(Ax),
=
((x,
VI),
= (LAX,
(x, v2) . . . , (x, va>>
VI), d2(x, v,), . . . , U
X ,
v,))
Así, por el teorema 6.3.2ay el hecho de que llxll = 1 se obtiene
(IXI(Z =
(x, Ax)
=
(x,
VI),
+ (x, V2)*
dI(X,v 1 ) 2 + &(x,
+ (x, V,)* = 1
v2)2 +
+ &(x, v,)2
f.
I
'
' ' '
Con estas dos ecuaciones y la fórmula (5) se puede demostrar que xTAx
sigue.
5
1, como
+ d,(x, v2)2 + . . . + &(x, V,)*
S al(x,
+ a,(x, v2)2 + . . + A , ( ~V,)2
,
=
v 1 ) 2 + (x,v2)* + . . . + (x, v,)2)
xTAx = (x,Ax) = d,(X, v,)*
I
=
dl
La demostración de que An xTAx es semejante y se deja como ejercicio.
Demostración de teorema 9.5.lb. Si x es un eigenvector de A correspondiente a
I, y llxll = 1, entonces
xTAx = (x, Ax) = (x, d l x ) = h , ( x , X > = d l ~ ~=xk~1 ~ 2
De manera semejante, xTAx = An si 11x11 = 1 y x es un eigenvector de A
correspondiente a I,. 0
EJERCICIOS DE LA SECCIÓN 9.5
1. ¿Cuáles de las siguientes
a) x' - t 6 . r y
expresionesson formas cuadráticas?
b) 5 ~ :- 2.x:
+
4
~
~
~
c)
2 4x:
-
3x5 + x;
-
5.r,x3
9.5 Formas cuadráticas / 559
d) x:
-
7x:
+ x: + 4x,x2x3
e) xIx2 - 3xlx3 + 2x2x3
f)
X:
-
+
6 ~ : .xI
-
5x2
8 ) (x I - 3x2
h) (xI - x ~ +
) ~
2(xI + 4x2)’
2. Expresar las siguientes formas cuadráticas en la notación matricial xTAx, donde A es
una matriz simétrica.
a) 3x:
+ 7xi
b) 4x:
-
9 x i - 6xlx2
c) 5x:
+ 5xIx2
d) - 7 ~ 1 %
3. Expresar la siguientes formas cuadráticas en la notación matricial x’Ax, donde A es
una matriz simétrica.
a) 9x: -x2
C)
+
~1x2
e) x:
+ 4x: + 6 x 1 ~ 2- 8 ~ 1 . ~+3
b) x:
~ 2 x 3
+~2x3
+ x:
- x: - x i
+X:
- 3 ~ -: 5xIx2+ 9 ~ 1 . ~ 3
d) V?X: -
~1x3
+ 2x,x, - 10x,x4+ 4 ~ ~ x 4
+ 2\fh1x2
-
8 ~ ~ 1 x 3
4. En cada inciso, encontrar una fórmula para la forma cuadrática en la que no aparezcan
5. En cada inciso, encontrar los valores máximo y mínimo de la forma cuadrática sujeta a
la restricción x! +’ x; = 1 y determinar los valores de x1 y xz en los que ocurren los
valores máximoy mínimo.
b) 7x: 4x: xlxz
c) 5x: 2x2 - xIx2 d) 2.r: +x: + 3X,X2
a) 5x: -x:
+
+
+
6. En cada inciso, hallar los valores máximo y mínimo de la forma cuadrática sujeta a la
restncción x: + +
= 1 y determinar los valores de xl, .xz y .x3 en los que ocurren
los valores máximosy mínimos.
44
a) x: + x i
c) 3x:
+ 2x:
-
2xlx2
+ 4x,x3 + 4x2x3
+ 2x: + 3x: + 2x,x3
b) 2x:
+ x;
+x:
+ 2xlx3 + 2x,x2
7. Mediante el teorema 9.5.2, determinar cuáles de las siguientes matnces son positivas
definidas.
8. Con el teorema 9.5.3, determinar cuáles de las matrices del ejercicio 7 son positivas
definidas.
9. Usando el teorema 9.5.2, determinar cuáles de las siguientes matrices son positivas
def~das.
Temas complementarios
560
1
IO. Por medio del teorema 9.5.3, determinar cuides de las matrices del ejercicio 9 son posidefinidas.
tlvas
11. En cada inciso, clasificar la forma cuadrática como posltiva defmida, positiva semide-
finida, negativa definida, negativa semidefinidao indefinida.
.Y; + .Y:
b)
- 3 ~ :
C) ( X , - x2)*
d j --(xl - xz)'
e) .x: --x:
f ) x,xz
--X:
a)
12. En cada Inciso, clasificar la matnz como positiva definida, positiva semidefinida, nega-
tiva definida, negativa semidefinida o indefinida.
a)
d)
[
-:-:-81
O
0
1
O 0 0
e) [O O O]
fj
[A y
O 0 1
O 0 0
13. Sea X'AX una forma cuadrática en x I ,x
,x,; definir T:Rn+ K por T(x) = x'dx.
a) Demostrar que T(x + y) = T(x) + 2x Ay + ?"(y). b) Demostrar que T ( b ) = pT(x).
c) ¿,Es T una transformación lineal? Explicar l a respuesta.
F.'
14. En cada inciso, encontrar los valores de k con los que la forma cuadrática es positiva
definida.
a) x: + kx:
c) 3 x i + .x:
-
4.x1x,
b) 5 ~ +
:
X:
+ kx: + 4 ~ ~ -x 2 ~ ~ x 3~ x , x ,
-
+ 2 4 + 2x1x3+ 2k.rzx3
15. Expresar la forma cuadrática (c,x, + czyz
+
,
. .
+ C~X,)~ en notación matricial xTAx,
donde A es simétrica.
se denomina media aé la muestra de x,, x2, . . . ,xn, y
se denomina variancia de la muestra.
a)Expresar la forma cuadrática S', enla
notación matricial xTAx, donde A es
simétrica.
b) ¿,Es S', una forma cuadrática positiva definida? Explicarla respuesta.
17. Cnmpletar la demostración del teorema 9.5. I probando que I n 5 xTAx si llxll = 1 ya,
= xTAx si x es un eigenvector de A correspondiente a An.
9.6 Diagonalización de formas cuadráticas; secciones cónicas 1 561
9.6 DIAGONALIZACIÓN DE FORMAS CUADf3ÁTICAS; SECCIONES
C~NICAS
En esta sección se mostrará cómo eliminar, cambiando las variables, los términos
de producto cruzado que hay en unaforma cuadrática, y los resultados se usarán
para estudiar las gráJcasde secciones cónicas.
DIAGONALIZACIÓN DE
FORMAS
CUADRÁTICAS
Sea
xTAx = [xI x2
..
'
x,]
una forma cuadrática, donde A es una matriz simétrica. Por el teorema 7.3.1 se
sabe que existe una matriz ortogonal
P que diagonalizaaA; es decir,
:I
donde Al, A2, . . . ,A,, son los eigenvalores deA . Si se hace
Y=
Y"
donde y,, y,, . . . ,y, son variables nuevas,y si en (1) se efectúa la sustituciónx =
P y , entonces se obtiene
X~A=
X ( P Y ) ~ A P=
Y yTPTAPy= yTDy
Pero
56.2
7emas complementarios
que es una forma cuadrática sin términos de producto cruzado.
En resumen, se liene el siguiente resultado.
Teorema 9.6.1. Sea xTAx una forma cuadrática en las variables xl, x,, . . . ,
x,, donde A es simétrica. Si P diagonaliza ortogonalmente a A y si las nuevas
variables -y1, y,, , . , , y , están dejnidas por la ecuación x = P y , entonces al
sustituir esta ecuación en xTAx se obtiene
x T A x = y7By =
donde A,. A2.
..
a,?; + A2y; + . . + A,;.
'
. .A , son los eigenvalores de A y
a, o
D=P%P=
I10
o
.
" '
0
d2 . . . O
.
o
...
,;
Se dice que la matriz P de este teorema diagonafiza ortogonafmente la forma
cuadrática, o que reduce f aforma cuadrática a una suma de cuadrados.
Ejemplo 1 Encontrar un cambio de variable que reduzca la
forma cuadrática
x: - x i - 4x,x2 + 4x2x3a una suma de cuadrados, y expresar la forma cuadrática
en términos de las nuevas variables.
Solución.
La forma cuadrática se puede escribir como
La ecuación característica de la matriz 3 x 3 es
2 - 1
2
o
2
A
-2
o
-2
a-tl
=a3-9d=A(d+3)(A-3)=O
de modo que los eigenvalores son A = O, A = -3, A = 3. Se deja al lector demostrar
que las bases ortonormales de los tres eigenespacios son
9.6 Diagonalización de formas cuadráticas; secciones cónicas
I'
563
Así, la sustitución x = Py con que se eliminan los términos de producto cruzado es
o bien, de manera equivalente,
x , = Qy,- iY, - UY3
2
x2 = +y, - QY2 + %Y3
x3 = Q y ,+ QY2 + +Y3
La nueva forma cuadrática es
o bien, de manera equivalente,
- 3y: + 3Y: A
Hay otros métodos para eliminar los términos deproducto
cruzado de una forma cuadrática, perono serán analizados aquí. Dos de los
métodos, la reducción de Lagrange y la reducción de Kronecker se estuhan en
textos más avanzados.
OBSERVACI~N.
SECCIONES
CÓNICAS
A continuación se aplicará l o aprendido hasta ahora sobre formas cuadráticas al
estudio de ecuaciones de la forma
ax2 + 2bxy
+ cy2 + dx + ey + f = O
(2)
donde a, 6, . . . ,f son, todos, números reales y por lo menos uno de los números a,
b, c es diferente de cero. Una ecuación de este tipo se denomina ecuación
cuadrcibica en x y y , y
ax2 + 2bxy
+ cy2
se denominaforma cuadrtitca asociada.
Ejemplo 2 En la ecuación cuadrática
3x2 + 5 x y - 7y2 + 2x + 7 = o
las constantes en (2) son
564
lentas cumplernentarios
0
= 3.
h :r
2
2,
L‘
z: ---
7
,(
d=2,
f=7 A
p=o,
Ejemplo 3
4x2
-
5.v’
i8v+
I\’
+y =o
9=o
4x’
-
5y’
xv
Las gráfkas de ecuaciones cuadráticas en x y y se denominan cónicas o
secciones cónicas. Las cónicas más importantes son las elipses, circunferencias,
hipdrbolas y parábolas; estas curvas se denominan cónicas no degeneradas. Las
demás cónicas se denominan degeneradas e incluyen los puntos simples y 10s
pares de rectas (véase el ejercicio 15).
Se dice que una cónica no degenerada está en posición normal con respecto
a los ejes de coordenadas si su ecuación se puede expresar en una de las formas
dadas en l a figura 1.
k<l
x‘
k’
k>l
?”
[’- 1; k. 1 > O
””
Fhperbola
Figura 1 (continúa en la página 565)
-
k=l
9.6 Diagonalización de formas cuadráticas; secciones conicas / 565
.v2 = kx
Parábola
x2 = ky
Parábola
Figura 1
Ejemplo 4 La ecuación
x2
y2
-+-=
4
9
x2
y2
lesdelaforma-+-=
k2 l 2
1 con k = 2 , 1 = 3
Por tanto, su gráfíca es una elipse en posición normal que corta el eje x en (-2, O)
Y (2,O) Y al ejey en (O, -3) Y (0, 3).
L a ecuación x2 - S 2 = - 16 se puede escribir de nuevo como ,912 - x2/16
= 1, que
es de la forma glk - x2/1= 1, con k
=
J2,1= 4. Por tanto, su gráfica es
una luperbola en posición normal que corta al ejey en (O, - JiT y (O, J2 1.
La ecuación 5x2 + 2y = O se puede volvera escribir como x2 = - *y. que es
de la forma 2 = ky con k = Como k < O, su gráfíca es una parábola en
posición normal cuyas ramas se abren hacia abajo, A
3.
IMPORTANCIA
DEL TÉRMINO
DE PRODUCTO
CRUZADO
Obsérvese que ninguna cónica en posición normal tiene término xy (es decir,
término de producto cruzado) en su ecuación; la presencia de un término xy en
la ecuación de una cónica no degenerada indica que la cónica no está rotada en la
posición normal y ha girado (figura 2a). También, ninguna cónica en
posición
normal tiene a la vez un término x* y un termino x o un termirno y 2 y un t.Cr;runo
y . Si no hay ténnino de producto cruzado. entonces la aparici6n de cualquiera de
estas parejas en la ecuación de una cónica degeneradaindica que la cónica est6
trasladada fuera de la posición nonnal (tigura 33).
566 / Temas complenzentarios
Una técnica para identificar la gráfica de una cónica no degenerada que no
esté en posición normal consiste en girar y trasladar los ejes de coordenadas xy a
fin deobtener un sistema de coordenadas x y con respecto al cual la cónica esté en
posición normal. Una vez hecho lo anterior, la ecuación de la cónica en el sistema
x y es de una de las formas dadas en la figura 1, por lo que se puede identificar
fácilmente.
h)
c.)
piq
Rotación y traslación
Ejemplo 5 Como la ecuación cuadráttica
2 x 2 + + * - 1 2 ~ - 4 , ~ +1 8 ~ 0
contiene términos 2,
x, 3 y y pero no contiene término de producto cruzado, su
gráfica es una cónica que no está en la posición normal y se ha trasladado pero no
ha girado. Esta cónica se puede colocaren posición normal trasladando de manera
apropiada los ejes de coordenadas. Para lograrlo, primero se agrupan los términos
x y y. Así, se obtiene
+
(2x2 - 1 2 ~ ) ( y 2- 4y) + 18 = O
o bien,
2(x2
-
6 ~ +) ( y 2- 4y)
-
18
Completando el cuadrado* en ambas expresiones entre paréntesis se obtiene
2(x2 - 6~ + 9) + ( y 2- 4~ + 4)
o bien,
2(x - 3)2
+(y
-
-
18
+ 18 + 4
2)* = 4
* Para completar al cuadrado una expresión de la forma x2 + px se suma y resta la constante @/2)2para
obtener
9.6 Diagonalización de formas cuadráticas; secciones cónicas / 567
Si los ejes de coordenadas se trasladan por medio de las ecuaciones de traslación
x"x-3,
y'=y-2
entonces (3) se convierte en
2x'2
+ y'* = 4
o bien,
X
-+"=I
I2
2
Y'*
4
que es la ecuación de una elipse en posición normal en el sistema x?. Esta elipse
se muestra en la figura 3. A
Figura 3
ELIMINACIóN
DEL TÉRMINO
DE PRODUCTO
CRUZADO
A continuación se mostrará cómo identlficar cónicas que no están en la posición
normal por haber girado. Si en las matrices 1 x 1 se omiten los corchetes, entonces (2) se puede escribir en forma matrlcial como
O
xTAx+Kx+ f = O
donde
Ahora, considérese una cónica C cuya ecuaciónen coordenadas xy es
x'Ax+Kx+ f = O
568 / Temas complementarios
Se quiere girar los ejes de coordenadas xy de modo que la ecuación de la cónica en
el nuevo sistema x’y’ no contenga término deproducto cruzado. Esto sepuede
lograr como se muestra enseguida.
Paso 1.
Encontrar una matriz
que diagonalice ortogonalmente la forma cuadrática xTAx.
Paso 2.
Intercambiar las columnasde P , encasodesernecesario,para
hacer det(P) = 1 . Esto asegura que la transformación ortogonal
de coordenadas
x
= Px‘,
esto es,
[;]
=p[;:]
es una rotación.
+
+f =O
+
+f =O
(Px‘)7A(Pxr) K ( P x ’ )
o bien,
( x ‘ ) ~ ( P ~ A P ) x(KP)x’
’
(6)
Como P diagonaliza ortogonalmente a A ,
londe A , y A, son eigenvalores de A . Así. (6) se puede volver a escribir como
,
[donde d ‘ = dp, + ep21 y e’ = dp,, + ep,,). Esta ecuación no contiene término
je producto cruzado.
9.6 Diagonalización de formas cuadráticas; secciones cónicas / 569
Este análisis se resume en el siguiente teorema.
Teorema 9.6.2. (Teorema de los ejes principales para R'). Sea
ax2
+ 2bxy + cy2 + dx + ey + f
=O
la ecuación de una cónica C,y sea
xrAx
= ax2
+ 2bxv + cy2
la forma cuadrcítica asociada. Entonces los ejes de coordenadas se pueden
girar de modo que la ecuación de C en el nuevo sistema de coordenadas x y
sea de la forma
jl,xr2
+ A2yI2+ d'x' + e'y'
tf =O
donde 1, y A2 son los eigenvalores de A . La rotación se puede efectuar
mediante la sustitución
x
= Px'
donde P diagonaliza ortogonalmente a xTAx y det(P) = l .
Ejemplo 6 Describir la cónica C cuya ecuación es 52 - 4xy + 8 3 - 3
=O
Solución. La forma matricial de esta ecuación es
X'AX - 36 = O
donde
La ecuación característica de A es
de modo que los eigenvalores de A son 1 = 4 y 1 = 9. Se deja para el lector demostrar que bases ortonormales para los eigenespacios son
570
/'
Temas complementarios
Asi,
P=
[
2'l v' V
33
-
"7
2/v3
diagonaliza ortogonalmente a aTAx. Además, det(P)
transformación ortogonal de coordenadas
x
=
1, demodoque
la
(8)
= Px'
es una rotación. Sustituyendo (S) en (7) se obtiene
( P x ' ) ~ A ( P x' ) 36 = O
o
( X ' ) ~ ( P ' A P ) X-' 36 = O
Como
PTAP=
lo
4 0
9]
esta ecuación puedeescribirse como
o
+
4 ~ " 9 ~ ' '- 36
1
O
O
que es la ecuación de la elipse mostrada en la figura 4. En esa figura. los vectores
v, y v 2 son los vectores columna de P. A
9.6 Diagonalización de formas cuadráticas; secciones cónicas 1 571
Ejemplo 7 Describir la cónica C cuya ecuación es
20
80
5x2-4xy+8y2+-~--y+4=0
v5v5
Solución. La forma matricial de esta ecuación es
xTAx+Kx+4=0
donde
Como se muestra en el ejemplo 6,
di ,onalizaortogonalmente a xTAx. Sustituyendo x = Px’ en (9) se obtiene
+
(PX’>~A(PX’)K(Px’)
+4 =O
o bien,
( X ’ ) ~ ( P ~ A P+
) X(KP)x’
’
+4 =O
(10) se puede escribir como
+
4 ~+ 9’ ~~” 8 ~-’ 3 6 ~ ‘ 4 = O
Para que la cónica esté en posición normal es necesario trasladar los ejes x y
Procediendo como en el ejemplo 5, (1 1) se vuelve a escribir como
4(x’2 - 2x’) + 9(y’2 - 4y’) = -4
Completando los cuadrados se obtiene
4(d2 - 2 ~ +‘ 1) + 9 ( ~-’ 4y’
~
+ 4)
-4
+ 4 + 36
572 / Temas complementarios
o bien,
4 ( ~' I)2
+ 9( y'
-
2)'
= 36
Si los ejes de coordenadas se trasladan mediante las ecuaciones de traslación
y
=X'
-
1,
y'
= j/
"
2
entonces (12) se convierte en
+
4 ~ ' ' 9yn2
~
= 36
o bien.
que es la ecuación de la elipse mostrada en la figura 5. En esa figura, los vectores
v1 y v2 son los vectores columna de P. A
EJERCICIOS DE LA SECCIóN 9.6
1. En cada inciso, encontrar un cambio de variable que reduzca la forma cuadrática a una
suma o diferencia de cuadrados, y expresar la forma cuadrática en términos de las
nuevas variables.
a) 2x: + 2.4 - 2x,x2 b) 5.4 2x2 + 4x,x2 c ) 2x,x2
d) -3n: + 5 x t i- 2,r,s,
+
9.6 Diagonalización de formas cuadráticas; .secciones cónicas 1 573
2. En cada inciso, encontrar un cambio de variable que reduzca la forma cuadrática a una
Suma 0 diferencia de cuadrados, y expresar la forma cuadrática entérminos de las
nuevas variables.
a) 3.4 + 4xz + 5x: + 4x1x2- 4~2x3
b) 2.4 + 5 ~ +
: 5 4 + 4x,-x2- 4x,X3 - 8X2X3
C) - 5x: + X: - X: + 6 1 , +
~ 4~~ 1 x 1
d) 2~1x3+ 6x2~3
3. Encontrar las formas cuadráticas asociadas a las siguientes ecuaciones Cuadraticas.
a) 2-x2- 3sy + 4y’
-
7x
+ 2.v + 7 = O
b) x’ - xy + 5x + 8y - 3 = O
e) y 2 + 7x - 8v - 5 = O
d ) 4x2 - 2 ~ =
’ 7
c) 5xy = 8
4. Encontrar las matnces de las formas cuadráticas del ejercicio 3.
5. Expresar cada una de las ecuaciones cuadráticas del ejercicio 3 en la forma matricial
X’AX
+ Kx + f = O.
6. Identificar las siguientes cónicas.
a) 2s’ + 5y2 = 20
b) 4x2 9y2= 1
e) x2 + y 2 - 25 = O
f) 7y2- 2x = O
‘
2
i) y - s 2 = o
J ) X - 3 = -y2
+
c) x2 - y 2 - 8 = O
d) 4y2 - 5x2 = 20
h) 3~ - 1 ly2 = O
g) -x2 = 2y
7. En cadainciso,la cónica estará enposiciónnormalpormedio
de una traslación.
Identificar la cónica y proporcionar su ecuación en el sistema de coordenadas trasladado.
b) x’ - 16y2+ 8n + 1 2 8 =
~ 256
a) 9x2 + 4,v’ - 36.x - 24y + 36 = O
C) -y2 - 8 s - 14.v + 49 = O
e) 2x2 - 3y2 6x 20y = -41
d ) x 2 + y 2 + 6 s - ~ O < V +1 8 = 0
f ) x2 + 1 0 +~ 7~ = -32
+ +
8. Las siguientes cónicas no degeneradas están rotadas fuera de l a posición normal y han
grado. En cada inciso, grar los ejes de coordenadas para eliminar el términox y . Identificar
la c h i c a y proporcionar su ecuación en el sistema de coordenadas queha girado.
a) 2 s 2 - 4 x , v - y 2 + 8b=)0x 2 + 2 x y + y 2 + 8 ~ + y = O
c) 5x2 + 4sy + S$ = 9
d ) 1 1x 2 + 2 4 . +
~ 4-V’
~ - 15 = O
En los ejercicios del 9 a 14, trasladar y girar los ejes de coordenadas, en caso de ser necesario, a fin de que la cónica esté en posición normal. Identificar la cónica y proporcionar su
ecuación en el sistema de coordenadas final.
9. 9s’ - 4Xy + 6 ) ~
- ~10s - 20,V
10. 3x2 - 8.w~- 1 2 ~ ’ 3 0 . ~- 64,~= O
5
11. 2 x 2 - 4 ~ . ~ - y 2 - 4 x - 8 v = - 1 4
13.
X‘ -
6xy - 7 ~ +
’ 1 O X + 2~3+ 9
12. 21x’
O
+ 6sy + 13y2
-
+
1 1 4 ~ 34.v + 73 = O
+
14. 4 ~ ’ 20.~1) 2 5 ~ ’- 15s - 6y = O
15. La gráfica de una ecuación cuadrática en x y y puede, en ciertos casos, ser un punto,
una recta o un par de rectas. Estas cónicas se denominan degenerodas. También es
posible que ningún valor real de x y y satisfaga la ecuación. En estos casos la ecuación
no tiene gráfica; se dice que representa una c h i c a imaginaria. Cadauna de las
siguientes expresiones representa una cónica de-generada o imaginaria. Cuando sea posible, trazar la gráfica.
a) x* -.v2 = O
b) S’ + 3y2 + 7 = O
C) 8 x 2 + 7 y 2 = O
d)x2-2xy+,v’=O
e) 9 x 2 + 1 2 s y + 4 y 2 - 5 2 =f0) s ’ + y 2 - 2 x - 4 y -=5
574
1
Temas complementarios
9.7 SUPERFICIES CUADRICAS
Enestasección
se aplicarán las técnicas de diagonalizaciónobtenidas en la
sección precedente a ecuaciones cuadráticas con tres variables, y los resultados
se usarán para estudiar superficies cuádricas.
SUPERFICIES
CUÁDRKAS
Una ecuación de la forma
ax2 + by2 + cz2 + 2dxy
+ 2exz + 2fyz + gx + hy + iz + j = O
donde notodos los coeficientes a, 6,
cuadrútica en x, y , y z; la expresión
ax2
.
.
.
(1)
, f son cero se denomina ecuación
+ by' + cz' + 2dxy + 2exz + 2f y z
se denominaforma cuadrútica asociada.
La ecuación (1) se puedeescribir en forma matricial como
[x y
o
z]
[:;:I[:]
d
b f
y
[:I
+[g h
i] y
+j=O
xTAx+Kx+j=O
donde
Ejemplo 1 La forma cuadrática asociada con la ecuación cuadrática
+
3x2 + 2y2 - z 2 + ~ X , V
- 8yz + 7~ + 2 y + 3~ - 7 = O
~ X Z
es
3x2
+ 2y2
- z2
+ 4xy + 3xz
-
8yz A
Las gráfkas de ecuaciones cuadráticas con variables x, y y z se denominan
superficies cuúdricas. Las ecuaciones más simples de superficies
cuádncas ocurren cuando estas superficies se colocan en ciertas posiciones
normales con respecto a los ejes de coordenadas. En la figura 1 se muestran las
seis superficies cuádricas básicas y las ecuaciones de estas superficies cuando éstas
se colocan en las posiciones normales mostradas en la figura. Si una superficie
cuádrica es cortada por un plano, entonces la curva de intersección se denomina
traza del plano sobre la superficie. Para ayudar a conceptualizar las superficies
cddricas de la figura 1, se muestran y describen las trazas formadas por planos
cuúdricas o
9.7 Superjcies cuádricas
/I
575
paralelos a los planos de coordenadas. La presencia de uno o más términos de
producto cruzado xy, xz y yz en la ecuación de una cuádrica indica que la cuádrica
está fuera de la posición normal y se ha girado; la presencia de ambos términos x2
y x, 2 y y o z2 y z en una cuádrica sin término de producto cruzado indica que la
cuádrica está trasladada fuera de la posición normal.
Ecuación
Superficie
Superficie
Ecuación
Cono elíptico
'
Los trazos en los planos de
coordenadas son elipses, así
como los trazos en los planos
paralelos a los planos de
coordenadas.
IHiperboloide I
Ide unahoja 1
"
Y A
V'
2'
m'
n2
"+""=
I'
1
El trazo en el plano xy es un
punto (el origen), y los trazos
en los planos paralelos al
plano xy son elipses. Los
trazos en los planos yz y xz
son pares de rectas que se
cortan en el origen. Los trazos
en los planos paralelos a éstos
son hipérbolas.
I
Paraboloide elíptico
El trazo en el plano xy es una
elipse, así como los trazos en
los planos paralelos al plano
xy. L o s trazos en los planos
yz y xz son hipérbolas, as¡
como los trazos en los planos
paralelos a éstos.
IHiperboloide de I
dos hojas
I
x
' - = -z'
- + - -"'
I'
m'
n2
Vo hay trazoen el plano x y .
En los planos paralelos al
)lano x y , que cortanla
uperfkie, los trazos son
:lipses. En los planosyz yxz
os trazos son hipérbolas, a s í
:om0 los trazos en los planos
malelos a éstos.
I
El trazo en el plano xy es un
punto (el origen), y los trazos
en los planos paralelos y por
encima del plano xy son
elipses. Los trazos en los
planos yz y xz son parábolas,
a s í como los trazos en los
planos paralelos a éstos.
Paraboloide hiperbólico
1
V2
-~ y'
x'
"
"
m'
I'
El trazo en el plano xy es un
par de rectas que se cortan en
el origen. Los trazos en los
planos paralelos al plano xy
son hipérbolas. Las hipérbolas
por encima del plano xy se
ls
abren en la dirección y, y a
que es^ por abajo lo hacen
:n la dirección x. Los trazos
m los planos yz y xz son
mrábolas, a s í como los trazos
:n los planos paralelos a éstos.
576
/'
Temas complementarios
Ejemplo 2 Describir la superficie cuádrica cuya ecuación es
4x2 + 3 6 ~ '- 9z2 - 1 6 -~216~1+304 = 0
Solución. Al reagrupar los términos se obtiene
4 ( ~ '- 4x1
+ 36(,~'- 6 ~ ) 9z2
-
--
304
Completando el cuadrado de los binomios entre paréntesis se obtiene
4(x2 - 4~
+ 4) + 3 6 ( ~ '
-
6.y
+ 9)
-
9 2 = -304
+ 16 + 324
O
4 (~ 2)2 + 36(y - 3)' - 9z2 = 36
O
(x
-
9
2)'
Z2
+(y-3)2--=
4
1
Trasladando los ejes por medio delas ecuaciones de traslación
se obtiene
que es la ecuación de un hiperboloide de una hoja. A
ELIMINACIÓN
DE LOS
TÉRMINOS DE
PRODUCTO
CRUZADO
El procedimiento para identificar cddricas que están fuera de la posiciónnormal
y se han girado, es semejante al procedimiento para las cónicas. Sea Q una superficie cuádrica cuya ecuación en coordenadas xyz es
xTAx+Kx+j=O
(2)
Se quiere girar los ejes de coordenadas xyz de modo que la ecuación de la cuádrica
en el nuevo sistema de coordenadas xlylz' no contenga términos deproducto
cruzado. Esto se puede efectuar como sigue:
Paso 1.
Paso 2.
Encontrar una matriz P que diagonalice ortogonalmente a xTAx.
Intercambiar dos columnas de P, en caso de ser necesario, a fin de
hacer det(P) = 1. Esto asegura que la transformación ortogonal de coordenadas
9.7 Super-cies cuádricas i 577
es una rotación.
Paso 3.
Sustituir ( 3 ) en (2). Así se obtiene una ecuación para la cuádrica en
coordenadas x'y'z' sin términos de producto cruzado. (La demostración es semejante a la de las cónicas y se deja como ejercicio.)
El siguiente teorema resume este análisis.
Teorema 9.7.1. (Teorema delos ejes principales paraR3). Sea
ux2
+ by2 + cz2 + 2dxy + 2exz + 2fyz + gx + hy + iz + j = O
la ecuación de una cuádrica Q, y sea
xTAx = ax2 + by2 + cz2
+ 2dxy + 2exz + 2fyz
la forma cuadrática asociada. Los ejes de coordenadas se pueden girar de
modo que la ecuación de Q en el sistema de coordenadas x'y'z' sea de la forma
donde A,, A2 y A3 son los eigenvalores de A . La rotación se puede efectuar por
medio de la sustitución
x
= Px'
donde P diagonaliza ortogonalmente a xTAxy det(P) = l .
Ejemplo 3 Describir la superficie cuádrica cuya ecuación es
4x2
+ 4y2 + 4z2 + 4xy + 4xz + 4yz
-
3
=
o
Solución. La forma matricial de la ecuación cuadrática anterior es
X'AX
-
3
=O
donde
Como se muestra en el ejemplo 1 de la sección 7.3, los eigenvalores de A son 1 = 2
y A = 8, y A es diagonalizada ortogonalmente por la matriz
5 78
1
Temas complementarlos
1
O
donde los dos primeros vectores columna en P son eigenvectores correspondientes
I= 2 y el tercer vector columna es un eigenvector correspondiente a 1 = 8.
a,
Como det(P) = I (comprobar), la transformación ortogonal de coordenadas x
= Px’ es una rotación. Sustituyendo estaexpresión en (4) se obtiene
( P x ’ ) 7 A ( P x ’) 3 =o
o bien, de manera equivalente,
(x’)7(P?4P)x’- 3 = O
Pero
[: :]
2
PTAP=
0
0
de modo que (5) se convierte en
o bien,
2s’* + 2y’*
+ 82”
=3
La ecuación anterior se puede volvera escribir como
z!?
-+-+-=I
312
3/2
318
que es la ecuación de un elipsoide. A
EJERCICIOS DE LA SECCION 9.7
1. Encontrar las formas cuadráticas asociadas con las siguientes ecuaciones cuadráticas
a)
Y‘+ 2y2 -- zz + 4.ry - 5.v~+ 7 1 + 22 = 3
C) X!’
e ) 3:’
+ +
+ 3.~2
Y 2
)JZ
-
1
14y
+9 =O
+
+
+
b) 31’ 7z’
2.uy - 317 4.1.2 - 3x = 4
d ) .xz +.v‘ - z’ = 7
f ) 2 2 2x2 +y2 2x -y 3z = o
+
2. Encontrar las matrices de las formas cuadráticas del ejercicio 1
+
+
9.8 Comparación de procedimientos para resolver sistemas lineales / 579
3. Expresar cada una de las ecuaciones cuadráticas dadas en el ejercicio 1 en la forma
matncial X'AX + Kx + j = O.
4. Identificar las siguientes cuádricas.
b) 2x2 + 6y2 - 3z2 = 18
e) 16x2 + y 2 = 162
+ 9y2 + 4z2 - 36 = O
d) 9x2 4y2 - z2 = O
g)x2+y2+z2=25
a) 36x2
+
6x2 - 3y2 - 2z2 -- 6 = O
f ) 7x2 - 3y2 + z = o
C)
5. En cada inciso, determinar las ecuaciones de traslación que colocan la cuádrica en
posición normal.
a) 9x2
+ 36y2 + 4z2
-
18x - l44y - 242
+
C) 3 ~ -' 3y2 - z2 + 4 2 ~ 144 O
e) x 2 + 16y2 + 2x - 32y - 16z - 15 = O
+ 153 = O
+
+
+
b) 6x2 3y2 - 2z2 12x - 18y - 8z = - 7
d) 4x2 9y2 - Z' - 54y - 5 0 =~ 544
f) 7 x 2 - 3 y 2 + 1 2 6 ~ + 7 2 y + ~ + 1 3 5 ~ 0
g ) ~ ~ + y ~ + ~ ~ - 2 ~ + 4 ~ - 6 ~ = 1 1
6. En cada inciso, encontrar una rotación x = Px' que elimina los términos de producto
cruzado. Identificar la cuádrica y escribir su ecuación en el sistema xyz'.
a) 2x2 + 3y2 + 23z2 72xz 150 = O
b) 4x2 + 4y2 + 4z2 + 4x-v + ~
C) 1 4 4 +~ 1~ 0 0 ~ 812'
~ - 2 1 6 -~ 5~4 0 ~ 7202 = O
d) 2xy + z = O
En los ejercicios del 7 al 10, trasladar y girar los ejes de coordenadas a fin de colocar la
cuádrica en posición normal. Identificar la cuádrica y escribir su ecuación en el sistema de
coordenadas final.
+
7.
+
+
+ 4yz
X Z
-
5=O
~ X Y + ~ X Z + ~ Y Z - ~ X - ~ Y - ~- 9
Z =
8. 7x2
+ 7y2 + 10z2
-
2xy
- 4x2
+ 4yz - 1 2 +~ 12.y + 602 = 24
9. 2 ~ ~ - 6 ~ + 1 0 ~ + ~ - 3 1 = 0
10. 2x2
+ 2y2 + 5z2
-
4xy - ~
+ 2yz + 1 0 -~ 26y - 22 = O
X Z
11. Demostrar el teorema 9.7.1.
9.8 COMPARACI~N
DE PROCEDIMIENTOS PARA RESOLVER
SISTEMAS LINEALES
En esta sección se analizarán algunos aspectos prácticos para resolver sistemas
de ecuaciones lineales, invertir matrices y encontrar eigenvalores. Aunque ya
antes se analizaron métodos para efectuar estos cálculos, los métodos no son
aplicables directamente a la solución por computadora de problemas en gran
esca!a que se presentan en aplicaciones del mundo real.
CONTEO DE
OPERACIONES
Debido a que las computadoras están limitadas en el número de cifras decimales
que pueden manejar, redondean o truncan casi todas las cantidades numéricas. Por
ejemplo, una computadora diseñada para almacenar ocho cifras decimales puede
registrar como .66666667 (redondeado) o como .66666666 (truncado). En cualquier caso se introduce un error denominado error por redondeo.
3
580 i Ternas complementarros
Las consideraciones prácticas principales al resolver problemas de álgebra
lineal en computadoras digitales son reducir el tiempo de computadora O, así el
costo) necesario para obtener Ea solución y disminuir inexactitudes debidas a
errores por redondeo. Asi, un buen algoritmo de cómputo usa el menor número de
operaciones posibley efectria tales operaciones de modo que reduce el efecto errores
de
por redondeo.
En estetexto se han estudiado cuatro métodos para resolver un sistema
lineal, A x = b, de n ecuaciones con n incógnitas:
1. Eliminación de Gauss con retrosustitución,
2. Eliminación de Gauss-Jordan.
3. Calculando A". obtener x = .-I b, y
4. La regla de Cramer.
Para comparar estos métodos como herramientas de cómputo es necesario
saber cuántas operaciones aritméticas requiere cada uno. En una computadora
moderna grande, los tiempos de ejecución representativos en microsegundos (1
microsegundo =
segundos) para las operaciones aritméticas básicas son
Multiplicación
División
Adición
Sustracción
1.O microsegundo
=
= 3 .O microsegundos
= 0.5 microsegundos
=
0.5 microsegundos
En este análisis se agruparán las divisiones y las multiplicaciones (tiempo medo
deejecución = 2.0 microsegundos), y también se agruparán las sumas y las
sustracciones (tiempo medio
ejecución
de
= 0.5 microsegundos). Las
multiplicaciones o divisiones se denominarán "multiplicaciones", y las adiciones y
sustracciones, "a&ciones".
En la tabla 1 se muestra el número de operaciones necesarias para resolver
un sistema lineal A x = b de n ecuaciones con n incógnitas aplicando cada uno de
los métodos analizados en el texto, así como el número de operaciones necesarias
para invertir a A o para calcular su determinante por reducción de renglones.
Método
Número de adiciones
' + $n * - gn
Resolver Ax = b por eliminación de Gauss-Jordan
in
Resolver Ax = b por eliminacióngaussiana
gn3
ResolverAx = b como
x =,4K1b
n3 - n2
+ gn2
-
gn
1
~
Encontrar det(A) por reducciónde renglones
Resolver Ax = b por laregla de C m e r
3.4
X
n
Número de multiplicaciones
TABLA 1 Conteo de operaciones para una matriz invertible A n
-
n 3 + n2
in' +in
i n 4 - I n 3 - Ln2
6
3
+1
6n
9.8 Comparación de procedimientos para resolver sistemas lineales / 581
Obsérvese que los métodos de eliminación de Gauss-Jordan y de eliminación
gaussiana proporcionados en el texto poseen el mismo conteo de operaciones. No
es dificil entender por qué esto es así. Ambos métodos empiezan con la reducción
de la matriz aumentada a la forma escalonada por renglones. Esto se denomina
fase hacia adelante o pase hacia delante. Luego la solución se termina por
retrosustituci.ón en la eliminación gaussiana y continuando la reducción hasta la
forma escalonada reducida en la eliminación de Gauss-Jordan. Esto se denomina
fase hacia atrris o pase hacia atrás. Resulta que el número deoperaciones
necesarias para la fase hacia adelante es elmismo, sin importar que seuse
retrosustitución o la reducción se continúe hasta llegar a la forma escalonada
reducida. Así, los métodos de eliminación gaussiana y de eliminación de GaussJordan proporcionados en el texto poseen el mismo conteode operaciones.
OBSERVACI~N.Existe una
variante común de la eliminación de Gauss-Jordan, menos
eficazquelapresentada en eltexto.Enelmétododeltexto,la
matriz aumentada
primero se expresa en forma escalonada reducida mediante la introducción de ceros
abajo de los unos principales; luego, la reducción se completa mdante la introducción de ceros arriba de los unos principales. Un procedimiento opciord es introducir
ceros abajo y arriba de un 1principal una vez obtenido éste. El método requiere
n3
"2
n
2
n2
adiciones
y
n3
2
-
+2
multiplicaciones
que son valores mayores que los aquí obtenidos para toda n 2 3.
Para ilustrar cómose calculan los resultados de la tabla 1, se obtendrá el
conteo de operaciones para la eliminación de Gauss-Jordan. Para llevar a cabo este
análisis se requieren las siguientes fórmulas de la suma de los n primeros enteros
positivos yla suma de los cuadrados de losn primeros enteros positivos:
1 2 + 2 2 + 3 2 + . . . + + 2 = n(n + 1)(2n + 1)
6
En los ejercicios se analizan métodos de obtención de estas fórmulas. También se
requieren las fórmulas para la suma de los n - 1 primeros enteros positivos y la
suma de los cuadrados de los n - 1 primeros enteros positivos. Las fórmulas se
pueden obtener sustituyendo n - 1 por n en (1) y (2).
582 / Temas complementarios
CONTEODE
OPERACIONES
PARA LA
ELIMINACIóN
DE GAUSSJORDAN
Sea Ax = b un sistema de n ecuaciones lineales con n incóptas, y supóngase que
que el sistema tiene una solución única. También
supóngase, para simplificar las cosas, que para escribir la matriz aumentada [A I
b] en forma escalonada reducida no se requiere ningún intercambio de renglones.
Esta hipótesis se justifica porel hecho de que los intercambios de renglones se
efectúan como regstro de operaciones en una computadora y requieren mucho
menos tiempo que las operaciones aritméticas.
en el
Comonoserequiere ningún intercambio de renglones, el primer paso
procesodeeliminacióndeGauss-Jordanesintroducir
un 1 principal en elprimer
renglón multiplicando los elementos de este renglón por el recíproco del elemento de
la izquierda en el renglón.Este paso se representa de manera esquemática
como sigue:
A es invertible, de
modo
1
x
x
’ . ‘
x
x i x
O
O
O
”.
O
0 ; .
X
I
1
1
O
O
O
O
O
O
..’
.’.
denota una cantidad que se calculará
denota una cantidad que no se calcula
Eltamañodelamatrizesn X ( n + 1 )
.
I
‘
I
.
I
O
o ; .
O
o ; .
I
Obsérvese que el 1 principal simplemente se registra y que no requiere cálculos:
sólo es necesario calcular los n elementos restantes en el primer renglón.
A continuación se presenta una descripción esquemática de los pasos
y el número de operaciones necesarias parareducir [A 1 b] a forma escalonada por renglones.
X
Paso 1
8
O
n multiplicaciones
O adiciones
O
O
Paso l a
O
n multiplicaciones/renglón
X
n a&ciones/renglón
n - 1 renglones que requieren
X
cálculos
X
Lo x
Paso 2
x
..’ x
x
X
1
I
n(n - 1) multiplicaciones
n(n - 1) adiciones
I
9.8 Comparación de procedimientos para resolver sistemas lineales
/ 583
n - 1 multiplicaciones/renglón
n - 1 adiciones/renglón
n - 2 renglones que requieren
cálculos
Paso 2a
I.
.
.
o o
o o
.
x
x
x
x
."
" '
x
x
n - l)(n
-
2) multiplicaciones
O
Paso 3
O
X
.
..
.
..
..
.
n - 2 multiplicaciones
O adiciones
I
n - 2 multiplicaciones/renglón
n - 2 adiciones/renglón
n - 3 renglones que requieren
cálculos
Paso 3a
...
I
..
.
X
n - 2)(n - 3) multiplicaciones
X
Paso
(n - 1)
O
O
..
..
..
..
..
I
2 multiplicaciones
O adiciones
I
X
O
Paso
2 multiplicaciones/rengló~
2 adicioneshenglón
1 renglones que requieren
cálculos
( n - l)a
I multiplicación
O adiciones
1
'
o o ". 1
o o o '.' o
0
'
I
'
'1
o j o
1 ; x
584
1’
Temas complementarios
Así, el número de operaciones necesarias para completar pasosconsecutivos es
como sigue:
Pasos 1 y l a
Multiplicaciones: n + n(n - 1) = n’
Adiciones:
n(n - 1) = n2 - n
Pasos 2 y 2a
Multiplicaciones: ( n - 1 ) + (I? - I )(n - 2) = ( n - 1 )’
Adiciones
(n-I)(n-2)=(n-l)’-(n1)
Pasos 3 y 3a
Multiplicaciones: ( n - 2) i( n - 2)(n - 3) = ( n - 2)’
( n - 2)(n - 3) = (n - 2)’ - ( n - 2)
Adiciones:
Pasos (n - 1) y (n - l)a
Multiplicaciones: 4 ( = 2’ )
Adiciones:
2(=2’-2)
Paso n
Multiplicaciones: I ( = I ’ )
Adiciones:
O ( = 1 2 - 1)
Por consiguente, el número total de operaciones necesarias para expresar [A
I b] en forma escalonada reducida es
+ ( n I)’ + ( n 2)’ + . . . + 1
[n’ + ( n - 1)’ + ( n - 2)‘ + . + 1 2 1
Multiplicaciones: n’
Adiciones:
-
-
’
’
-[n+(n-l)+(n-2>+”’+1]
o bien, aplicando las fórmulas (1) y (2),
Multiplicaciones:
Adiciones:
n(n
+ 1)(2n + 1) - n 3 +-+n2 n
n(n +
(5 1
”
6
1)(2n + 1)
6
3
2
6
n(n + 1) - n 3
2
3
n
3
(6)
Así se completa el conteo de operaciones para la fase hacia adelante. Para la fase
hacia atrás es necesario escribir la forma escalonada de [A 1 b] en forma escalonada reducida mediante la introducción de ceros por arriba de los 1 principales. A
continuación se muestran las operaciones:
9.8 Comparación de procedimientos para resolver sistemas lineales i 585
Paso 1
'1
O
O
'..
@
0
1
O
" '
0
o o
" '
0
I
.
.
.
.
1
.
.
f
.
.
o o o
-0 o o
Paso
o1 x
ojx
ojx
.
".
".
.
I
.
'
1
.
I
ojx
o
1
j
O
O
... o o j x
o 1
o o
0
" '
1
.
..
...
1
...
o o o
o o o
" '
I
I
.
.
'
'.'
n
o ojx
o ojx
.
" '
n - 1 multiplicaciones
. I .
.
.
1
.
.
I
.
1 adiciones
1
n
n
'
'
-
-2
-
multiplicaciones
2 adiciones
1 o j o
o
I / .
Paso
(n - 2)
.
.
.
.
.
.
.
.
.
Paso
.
l
.
.
I
.
.
I
.
o o o
o1 0
o o o ... o 1 ; .
'1 o o . . ' o o I x o 1 o ..' o 0 1 0
" '
( n - 1)
..
.
1
o o
.
..
.
..
o
1
.
..
o o o
,o o o
.
'
'
I
.
I
.
'.'
" '
0 ;
.
I
0
.
1 adición
'
'
1 o j o
o
1
j
0-
Así, el número de operaciones necesarias para la fase hacia atrás es
Multiplicaciones: ( n - 1) + ( n - 2) + . . . + 2
Adiciones:
(n- l)+(n-2)+...+2+
+1
1
o bien, aplicando la fórmula ( 3 ) ,
Multiplicaciones:
Adiciones:
(n - l)n
~
2
n2
2
- "-
n
2
( n - 1)n "n2 n
2
2 2
"
Así, por ( 9 , (6), (7) y (S), el conteo total de operaciones para la eliminación de
Gauss-Jordan es
586
/
Temas complementarios
COMPARACI~N
DE METODOS
PARA
RESOLVER
SISTEMAS
LINEALES
En aplicaciones prácticas no es raro encontrar sistemas lineales de milesde
ecuaciones con miles de incógnitas. Así, la tabla 1 reviste especial importancia
para grandes valores de n. Unhecho verdadero para polinomios es que para
grandes valores de la variable, un polinomio puede ser bien aproximado por su
término de grado más alto; es decir, si ak f O, entonces
u.
+ u,x + . . . + q x k -
ukxk
parax grande
(ejercicio 12). Así, para grandes valores de n, el conteo de operaciones en la tabla
1 se puede aproximar como se muestra en latabla 2.
Por la tabla 2 se deduce que cuando n es grande los mejores métodos para
resolver A x = b son la eliminación gaussiana y la eliminación de Gauss-Jordan. E1
método de multiplicar porA"es bastante peor que los anteriores (requiere el triple
de operaciones), y el método más ineficaz de los cuatro es la regla de Cramer.
TABLA 2 Conteo aproximado de operacionespara una matriz invertible n x n
con n grande
I
I
Método
Número de
adiciones
Resolver Ax = b por eliminación de GaussJordan
i
T
-
n3
Resolver Ax = b por eliminación gaussiana
EncontrarA-l reduciendo [A
I
I] a [I /A]"
multiplicaciones
"
3
=n3
Resolver A x = b como x = A"b
%n3
Encontrar det(A) por reducción derenglones
=-
Resolver A x = b por la regla de Cramer
i
T
-
n3
3
n4
3
n3
x-
3
9.8 Comparación de procedimientos para resolver sistemas
lineales / 587
En la observación a continuación de la tabla 1 se mencionó que
si la eliminación de Gauss-Jordan se efectúa mediante la introducción de ceros
arriba y abajo de los unos principales tan pronto como se obtienen éstos, entonces
el conteo de operaciones es
OBSERVACI~N.
n3
"-
2
n
2
adiciones
y
n3 n2
+multiplicaciones
2
2
-
= n3/2 operaciones, que es 50%
mayor que las n3/3 multiplicaciones necesarias para efectuar el método presentado
en el texto. Lo mismo secumple para las adic';ones.
Es razonable preguntar si sepueden crear otros métodos para resolver
sistemas lineales que pudieran requerir sigmficativamente menos operaciones que
las = n3/3 adiciones y multiplicaciones necesarias en la eliminación gaussiana y
en la eliminación de Gauss-Jordan. La respuesta es un "sí" categórico. En años
recientes se han creado métodos que requieren = Cnq multiplicaciones, donde q es
ligeramente mayor que 2.5. Sin embargo, estosmétodos tienen poco valor
práctico, ya que su programación es complicada, la constante C es muy g r a d e y el
número de adiciones necesarias es excesivo. En pocas palabras, en la actualidad no
existe ningún método práctico para resolver sistemas lineales generales que mejore
sigruficativamente elconteo de operaciones de la eliminación gaussiana y del
método de eliminación de Gauss-Jordan presentado en el texto.
Así, para n grande este procedimiento requiere
EJERCICIOS DE LA SECCION 9.8
1. Encontrar el número de adiciones y multiplicaciones necesarias para calcular AB si A
esunamatrizm
X
nyBesunamatrizn x p .
2. Usando
los
resultados del
ejercicio
1, encontrar número
el
de
adiciones
y
multiplicaciones necesarias para calcular Ak por multiplicación directa si A es una
matriz n X n.
3. Suponiendo que A es una matriz n X n, usar las fórmulas de la tabla 1 para determinar
el número de operaciones necesarias para efectuar los procedimientos dela tabla 3.
Tabla 3
Resolver Ax
"
. . . ."
=b
por la reglade Cramer
588 / Temas complementarios
4. Suponiendo un tiempo de ejecución en computadora de 2.0 microsegundos para las
multiplicaciones y de 0.5 microsegundos para las adiciones, usar los resultados del
ejercicio 3 para escribir los tiempos de ejecución en segundos necesarios para efectuar
los procedimientosde la tabla 4.
Tabla 4
5. Obtener la fórmula
n(n + 1)
1 +2+3+,..+n=----2
[Sugerencia Sea Sn = 1 + 2 + 3 + . . . + n. Escribir lostérminosde S, enorden
invertido y sumar las dos expresiones para S,.]
6. Usando el resultado del ejercicio 5, demostrar que
1+2+3+...+(n-l)=-
(n - 1)n
2
7. Obtener la fórmula
12+22+32+...+n2=
n(n
+ l)(2n + 1)
6
realizando los pasos siguientes.
a) D e m o s t r a r q ~ e ( k + l ) ~ - p = 3 3 k 2 + 3 k + 1 .
b) Demostrar que
[2' - 1 3 ] + [33 - z3] + [43 - 33] + . . . + [ ( n + 1)3 - n 3 ] = ( n + 1)'
-
1
c) Aplicando a) a cada término del miembro izquierdo de
b), demostrar que
(n+1)3-~=3[12+22+32+~..+n2]+3[1+2+3+~..+n]+n
d) Resolver la ecuación del incisoc) para l 2 + 22 + 32 + . .
ejercicio 5 y luego simplificar.
8. Usando el resultado del ejercicio 7, demostrar que
12+22+32+'"+(n")
-
-
(n - l)n(2n
6
-
1)
.
+ ,'n usar el resultado del
9.9 Descomposiciones L U
589
9. Sea R la forma escalonadade una matriz invertiblen X n. Demostrar que para resolver
el sistema lineal Rx = b por retrosustitución se requieren
n2 n
"multiplicaciones
2
2
n2
"- n
2
2
adicisnes
10. Demostrar que para reducir una matriz invertible de n X n a I, aplicando el método del
texto se requieren
n3
"-
3
n
3
multiplicaciones
n3 n2 n
-"
+ - adiciones
3
2
6
[Nota Supóngase que no se requiere ningún intercambio de renglones.]
11. Considérese la variante de la eliminación de Gauss-Jordan en que se introducen ceros
arriba y abajo de un 1 principal tan pronto como se obtiene éste, y sea A es una matriz
invertible n X n. Demostrar que para resolver un sistema lineal A x = b usando esta
versión de la eliminación de Gauss-Jordanse requieren
n3 n 2
+multiplicaciones
2
2
-
n3 n
-"
2
2
adiciones
[Nota Supóngase que no se requiere ningún intercambio de renglones.]
12. (Paru quienes ya estudiaron C&lculo).Demostrar que si p ( x ) = u. + a , x + . . . + a,.",
donde ak # O, entonces
[Nota Este resultado justifica la aproximación
grande.]
a.
+ u,x + .
. .
+ ukx" = ".,u
para
x
9.9 DESCOMPOSICIONES LU
Con la eliminación gaussiana y la eliminación de Gauss-Jordan se resuelve un
sistema lineal operando sistemáticamente sobre la matriz aumentada. En esta
sección se analizar&un método difrente basado en la factorización de la matriz
de coejkientes en un producto de dos matrices: una triangular inferior y otra
590 / Temas complementarios
de coe3cientes en un producto de dos matrices: una triangular inferior y otra
triangular superior. Este método es adecuadopara computadoras digitales y
*
constituye una base paramuchos programas de cómputo prácticos.
SQLUCIÓN DE
SISTEMAS
LINEALES POR
FACTORIZACIÓN
Se procederá en dos partes. Primero se mostrará cómo un sistema lineal Ax = b se
puede resolver fácilmente una vez que A se factoriza en un producto de
dos
matrices: una triangular inferior y otra triangular superior. Luego se mostrará cómo
obtener la factorización.
Si una matriz A n x n se puede factorizar en un producto de matrices n X n
como
A=LU
donde L es triangular inferior y U es triangular superior, entonces el sistema lineal
Ax = b se puede resolver comosigue:
Paso 1.
Volver a escribir el sistema Ax
=b
como
LUX = b
Paso 2.
Definir una nueva matriz y de n
X
(1)
1 por
ux=y
Paso d.
Usar (2) para volver a escribir (1) como Ly
tema para y.
Paso 4.
Sustituir y en (2) y despejar x.
(2)
=
b y resolver este sis-
Aunque este procedmiento reemplaza el problema de resolver el simple sistema
Ax = b por el problema de resolver los dos sistemas Ly = b y Ux = y, éstos se
resuelven fácilmente porque las matrices de coeficientes son triangulares. El
siguiente ejemplo ilustra este procechmiento.
Ejemplo 1 Después, en esta sección se obtendrá la factorización
Usando este resultado y el método antes descrito, resolver el sistem;,
*
En 1979, los ArgonneNationalLaboratoriesdesarrollaronuna
importante biblioteca,denominada
LINPAK, de programas de Algebra lineal independientes de la máquina. Muchos de los programas de t a l
biblioteca est&? basadosen los métodos que se analizan en esta sección.
9.9 Descomposiciones LU / 591
Solución. (3) se vuelve a escribir como
Como se especifica en el paso 2 anterior, y,, yz y y3 se definen por la ecuación
de modo que (3) se puede volver aescribir como
o bien, de manera equivalente,
2Y I
=2
-3Y, + Y 2
=2
4,Vt - 3J)2 + 7Y3 = 3
El procedimiento para resolver este sistema es semejante a la retrosustitución,
excepto que las ecuaciones se resuelven de arriba hacia abajo, en vez de abajo
hacia arriba. Este procedmiento, denominado srustitucidn hacia adelante, produce
(comprobar). Sustituyendo estos valores en (5) se obtiene el sistema lineal
o bien, de manera equivalente,
x,
+ 3x2 +
x2
x, = 1
+ 3x, = 5
x3 = 2
Resolviendo este sistema por retrosustitución se obtiene la solución
x,=2,
(comprobar). A
x2=-l,
x3=2
592
i Temas complementarios
DESCOMPOSICIONES LU
Ahora que ya se ha visto cómo un sistema lineal de n ecuaciones en n incógnitas
sepuederesolver factorizando la matriz de coeficientes, se volverá al problema de
obtener la factorización. Para originar el método, supóngase que una matriz '4 n X
n se ha reducido a una forma escalonada U mediante una sucesión de operaciones
elementales en los renglones. Por el teorema 1.5.1, cada una de estas operaciones
se puede efectuar multiplicando por la izquierda poruna
matriz elemental
apropiada. Así, es posible encontrar matrices elementales E,, E,, . . . , Ek tales que
E L .' . E 2 E , A = U
(6)
Porel teorema 1.5.2, E,, E
, Ek son invertibles, demodo que es posible
2'
'.
multiplicar sucesivamente por la izquierda ambos miembrosde la ecuación (6) por
'
para obtener
A = E ; 'E,
1
. . . E"
(7)
k
En el ejercicio 5 se ayudará al lector a demostrar que la matriz L definida por
L = E" ] E - 1 . . .
I
1
2
(8)
es triangular lnferior en el supuesto de que
para reducir A a U no se efectúe ningún intercambio de renglones. Suponiendo que este es el caso, sustituyendo (8) en (7) se
obtiene
A= LU
que es una factorización de A en un producto de una matriz triangular inferior y
una matriz triangular superior.
El siguiente teorema resume el resultado anterior.
Teorema 9.9.1. Si A es una matriz cuadrada que se puede reducir a una forma
escalonada U sin aplicarningúnintercambio
de renglones, entonces A se
puede factorizarcomo A = LU, donde L es una matriz triangular inferior.
Definición. Una factorización de una matriz cuadrada A como A = LU, donde
L es triangular inferior y I/ es triangular superior, se denomina descomposición
LU o descomposición triangular de A :
Ejemplo 2 Encontrar una descomposición LU de
2
A=[-:
-:
6
2J
Solución. Para obtenerunadescomposición LU, A = LU, A se reducirá a una
forma escalonada iJ, y luego L se calculará a partir de (8). Los pasos son:
9.9 Descomposiciones LU / 593
Reducción a la
forma escalonada
Matriz elemental que
corresponde a la operación Inversa de la matriz
elemental
en los renglones
Paso 1
1
3
Paso 2
Paso 3
-4
Paso 4
Paso 5
o
1
594 / Temas complementarios
Así,
Y> por (8):
oj[o
o
1
-3
2
de modo que
0
1 0 0
1
1
O 0 7
0
[-:-: !I=[
2
0
6
2
-3
4
0
-3
:][A ;
7
'1
O 0 1
es una descomposición LU de A . A
PROCEDIMIENTO PARA
ENCONTRAR
DESCOMPOSICIONES LU
Como se muestra en este ejemplo,casitodoel
trabajo para obtener una
descomposición LU se invierte en el cálculo de L . Sin embargo, todo este trabajo
se puede eliminar llevando un registro cuidadoso de las operaciones usadas para
reducir A a U. Como se supone que no se requiere ningún intercambio de renglones para reducir A a U, entonces sólo se realizan dos tipos de operaciones: la
multiplicación de un renglón por una constante diferente de cero y la adición de un
múltiplo de un renglón a otro renglón. La primera operación se usa para introducir
los unos principales y la segunda para introducir ceros abajodelosunos
principales.
En elejemplo 2 los multiplicadores necesarios para introducir los unos
principales en renglones consecutivos son:
3para el primer renglón
1 para el segundo renglón
f para el tercer renglón
Obsérvese que los elementos diagonales sucesivos en L eran precisamente los
recíprocos de los multiplicadores (figura 1).
9.9 Descomposiciones L U / 595
Luego, obsérvese que para introducir ceros por abajo del 1 principal en el primer
renglón se realizaron las siguientes operaciones:
sumar 3 veces el primer renglón al segundo renglón
sumar -4 veces el primer renglón al tercer renglón
y para introducir el cero por abajo del 1 principal en el segundo renglón se efectuó
la siguiente operación
sumar 3 veces el segundo renglón al tercer renglón
Ahora se observa que en cada posición abajo dela &agonal principal de L (en tipo
negro) el elemento es el negativo del multiplicador en la operación con que se
introdujo el cero en esa posición en U (figura 2).
L=[p-JJ
Figure 2
En resumen, se tiene el siguiente procedimiento para obtener
una
descomposición L U de u a matriz cuadrada A , en el supuesto de que A se pueda
reducir a la forma escalonada sin efectuar ningún intercambio de renglones.
Paso 1.
Reducir A a una forma escalonada U sin efectuar ningún intercambio
de renglones y sin perder de vists los multiplicadores usados para introducir los unos principales y de los multiplicadores usados para
introducir los ceros abajo de los unos principales.
Paso 2. En cada posición a lo largo de la diagonal principal de L escribir el
recíproco del multiplicador con que se introdujo el uno principal en
esa posición de U.
Paso 3. En cada posición por abajo de la diagonal principal de L escribir el
negativo del multiplicador usado para introducir el cero en esa
posición de U.
Paso 4. Formar la descomposiciónA = L U.
Ejemplo 3 Encontrar una descomposición LU de
”;[; -; ;]
6
-2
O
596 / Temas complementarios
Solucidn. Se empezará por reducir A a forma escalonada sin perder de vista a los
multiplicadores.
-
multiplicador = 4
/-
1
"
-
c-multiplicador =
[ ," $ i]
1
-9
multiplicador = - 3
-1.
t-multiplicador
=$
t-multiplicador
=
-
t-multiplicador
=
1
8
real, dado que en el tercer renglon ya
Al construir L a partir de los multiplicadores se obtiene la descomposición LU.
6
A=LU=
0
0
1
O
-$
j[O A /] *
9 2 O
[3 8
Esta sección concluyecon un breve análisis de dos preguntas fundamentales
sobre las descomposicionesL U:
1. ¿Toda matriz cuadrada tiene una descomposición L I/?
¿Es posible que una matriz cuadrada tenga más de una descomposición L U?
2.
Ya se sabe que si una matriz cuadrada A se puede reducir a la forma
escalonada sin aplicar ningún intercambio de renglones, entonces A tiene una
descomposición L U. En general, si para escribir A en forma escalonada se requiere
intercambiar renglones, entonces no existe ninguna descomposición L U de A . Sin
embargo, en esos casos es posibIe factorizar A en laforma
A = PLU
9.9 DescomposicionesLU 1 597
donde L es triangular inferior, U es triangular superior y P es la matriz que se
obtiene al intercambiar los renglones de I,, de forma idónea (ver el ejercicio 17).
Cuando no hay restricciones adicionales, las descomposiciones LU no son
únicas. Por ejemplo, si
y los elementos diagonales de L son diferentes de cero, entonces es posible
desplazar los elementos diagonales del factor izquierdo al factor derecho
escribiendo
que es otra descomposición triangular de A .
EJERCICIOS DE LA SECCION 9.9
1. Usar el método del ejemplo 1 y la descomposiciónLU
[-:-:I=[-: u][:, -:]
para resolverel sistema
3x,
-2x,
-
6x2 = O
+ 5x, = 1
2. Usar el método del ejemplo 1 y la descomposiciónLU
para resolverel sistema
598 / Temas complementarios
3x1 - 6x2 - 3x3 =
+ 6x3 = -22
2x1
-4x1
-3
+ 7x2 + 4x,
3
=
En los ejercicios del 3 al 10, encontrar una descomposición LU de la matriz de coeficientes;
luego, usar el método del ejemplo 1 para resolver el sistema
=[-;I
11. Sea
2
A=[-:
-;
1
-
a]
a) Encontrar una descomposiciónLU de A
b) Expresar A en la forma A = L,DU,, donde L , es una matriz triangular inferior con
unos en la diagonal principal, U , es unamatriz triangular superior y D es una
matnz diagonzl.
c) Expresar A en la forma A = L2U2, donde L, es una matriz tnangular inferior con
unos en la diagonal principal y U2es una matriz tnangular superior.
12. Demostrar que la matriz
no tiene descomposiciónLU.
13. Sea
a) Demostrar: Si A f O entonces A tiene una descomposiciónLU única con unos en la
diagonal principal de I..
b) Encontrar la descomposiciónLU descrita en el inciso a).
9.9 Descomposiciones LU / 599
14. Sea Ax = b un sistema lineal de n ecuaciones con n incógnitas, y supóngase que A es
una matriz invertible que se puede escribir en forma escalonada sin efectuar ningún
intercambioderenglones. ¿Cuántas adiciones y cuántasmultiplicacionessonnecesarias para resolver el sistema aplicando el método del ejemplo l ? [Nota Contar las
sustracciones como adiciones y las divisiones como multiplicaciones.]
15. a) Demostrar: Si L , y L, son matrices triangulares inferiores n X n, entonces también
L,L, es triangular mferior.
b) El resultado del inciso a) es un caso especial de un resultado general que establece
que el producto de un número finitode matrices triangulares mferioreses triangular
inferior. Usando este hecho, demostrar que la matriz L en (8) es triangular inferior.
[Sugerencia Véase el ejercicio 27 de la sección 2.4.1
16. Usando el resultado del ejercicio 15b), demostrar que el producto de un número finito
de matnces triangulares superiores es triangular superior. [Sugerencia Considerar las
transpuestas.]
17. Demostrar: Si A es cualquier matriz n X n, entonces A se puede factorizar como A =
PLU, donde L es triangular inferior, U es triangular superior y P se puede obtener
intercambiando en forma adecuada los renglones de I,. [Sugerencia Sea U la forma
escalonada de A y efectuar primero todos los intercambios de renglones necesarios en
la reducción deA a U.]
18. Factorizar
como A = PLU, donde P se obtiene a partir de Z3 al intercambiar de manera apropiada
los renglones, L es triangular inferior y U es triangular superior.
CAPITULO
10
ESPACIOS
VECTORLALES
COMPLEJOS
10.1 NÚMEROS COMPLEJOS
Hasta el momento sólo se han considerado espacios vectoriales para los cuales
los escalares son números reales. Sin embargo, en muchas aplicaciones importantes de vectores es aconsejable dejar que los escalares sean números complejos. Un espacio vectorial que permite escalares complejos se denomina espacio vectorial complejo, y uno que sólo permite escalares reales se denomina
espacio vectorial real. Una ventaja de pvrmitir escalares complejos es que todas
las matrices con elementos escalares complejos tienen eigenvalores, lo cual no es
cierto si solamente se permiten escalares reales. Por ejemplo, la matriz
tiene al polinomio característico
de modo que la ecuación característica, A2 + 1 = O, no tiene soluciones reales y
por tanto carece de eigenvalores.
En las tres primerassecciones de este capítulo se repasarán algunas de las
propiedades básicas de los números complejos, y en secciones ulteriores se analizarán espacios vectoriales complejos.
601
602 / Espacios vectoriales complejos
NÚMEROS
COMPLEJOS
Como x2 2 O para todo número real x, la ecuación
x2=
-1
no tiene soluciones reales. Para manejar este problema, los matemáticos del siglo
XVIII introdujeron el número "imaginario"
i = l / r-"
1
que sesupone tiene la propiedad
pero que de otra forma podía considerarse como un número real. Expresiones de la
forma
a + bi
donde a y b son números reales reciben el nombre de "números complejos", los
cuales se operan según las reglas normales dela aritmética, con la propiedad
adlcional de que i2 = - l .
A principios de siglo XIX se aceptaba que un número complejo
a + hi
se considerará como otro símbolo para el par ordenado
de números realesy que las operaciones deadición, swtmcción, multiplicación y &visión se definieran sobreestos pares ordenados de modo que
se cumplieran las leyes conocidas de la aritmética y además i2 = - l . Este enfoque es el que se seguirá en el
texto.
Definición. Un nrimero complejo es un par ordenado de números reales,
denotado por (a,b ) o a + bi.
Ejemplo 1 A continuación se presentan algunos ejemplos de números complejos
f:n ambas notaciones:
Par ordenado
(3>4)
(- 1,2)
(0, 1)
(290)
(4, -2)
Notación equivalente
3 + 4i
- 1 +2i
O+i
2 + Oi
4
+ (-2);
Para facilitar las cosas, los tres últimos números complejos en general se abreviarán como
I O.I Núnteros complejos / 603
O+i=i,
A
2 + 0 i 4=+2 (, - 2 ) i = 4 - 2 i
Geométricamente, un número complejo se puede considerar como un punto
o un vector en el plano xy (figura 1).
ty
t
Figura 1
I Un número complejo se puede considerar como un punto o un vector. I
Ejemplo 2 En la figura 2a algunos números complejos se muestran como puntos y
en la figura 2b, como vectores. A
I
t
- 4 - 32
Figura 2
EL PLANO
COMPLEJO
b)
Q)
Algunas veces es conveniente usar una sola letra, como z, para denotar un número
complejo. Así, se podría escribir
z=a+bi
El número real a se denomina parte real de z y el número real b, parte imaginaria
de z. Estos números se denotan por Re(z) eIm(z), respectivamente. Por tanto,
Re(4 - 3i) = 4
'e
Im(4 - 3i) = - 3
Cuando los números complejos se representan geométricamente en,un
sistema de coordenadas q v , el eje x, el eje y y el plano se denominan eje real: .+e
imaginario y plano complejo, respectivamente (figura 3).
604 / Espacios vectoviales complejos
t
Figura 3
OPERACIONES
CON NUMEROS
COMPLEJOS
I
Eje imaginario
(Parte real de z)
Así como se define que dos vectores en R2 son iguales si tienen las mismas componentes, también dos números complejosson iguales si tanto sus partes reales
como sus partes imaginarias son iguales:
Definición. Dos números complejos u + bi y c
cribe como
a + bi
=c
+ di son iguales, lo que se es-
+ di,
Si b = O, entonces el número complejo a + D i se reduce a a + Oi, que se
escribe simplemente como a. Así, para cualquier número real a,
a=a+Oi
de modo que los números reales se pueden considerar como números complejos
cuya parte imagmaria es cero. Geométricamente, los números reales corresponden
a puntos sobre el eje real. Si se tiene a = O, entonces a + bi se reduce a O + bi, que
en general se escribe como bi. Estos números complejos, que corresponden a
puntos sobre el eje imaginario, se denominan nrimeros imaginarios puros.
Así como la adición de vectores en R2 se realiza sumando las componentes
correspondientes de los vectores, también la adición de números complejosse
realiza sumando las partes y las imaginarias:
(u
+ bi) f (c + d i ) = ( a + c ) + ( b + d)i
(1)
Las operaciones de sustracción y multiplicación por un número real también son
semejantes a las operaciones vectoriales correspondientes en R 2 :
I
(a
+ bi) - ( c + d i ) = (a - c ) + ( D - d)i
I k(a + bi)
= (ka) t (kb)i,
k real
I
I
(2)
(3)
Debido a que las operaciones de adición, sustracción y multiplicación de un
número complejo por un número real son semejantes a las operaciones correspon-
1O.1 Números complejos 1 605
dientes para vectores en R2, las interpretaciones geométricas conocidas de estas
operaciones se cumplen para números complejos (figura 4).
Por la expresión (3) se deduce que (- l)z + z = O (comprobar), de modo que
( - l)z se denota por -z y se denomina negativo de z.
Solución.
z,+zz=(4-5i)+(-l+6i)=(4-1)+(-5+6)i=3+i
zl-zZ=(4-5i)-(-l +6i)=(4+ 1)+(-5-6)i=5- lli
32, = 3(4 - 5i) = 12 - 15i
- z Z = ( - 1 ) z z = ( - 1 ) ( - 1 + 6 i ) = 1 -6i A
Suma de dos números
complejos.
Diferencia
de
dos números
complejos.
f’
I
Figura 4
f’
(k >O)
Producto
de
(k
un números
complejo
O)
z y un número
real
k.
Hasta ahora se ha encontrado un paralelismo entre los números complejos y
los vectores en R2. Sin embargo, a continuación se definirá la multiplicación de
números complejos, una operación que no tiene análogo vectorial en R2. Para
originar la definición, se desarrollará el producto
(a
+ bi)(c + di)
606 / Espacios vectoriales complejos
siguiendo las reglas algebraicas de costumbre, pero considerando a i2 como - 1.
Así, se obtiene
(a
+ bi)(c + di) = ac + bdi2 + adi + bci
=
(OC -
b d ) + (ad + b ~ ) i
lo cual sugiere la siguiente definición:
(a
+ bi)(c + di)= (ac - b d ) + (ad + bc)i
Ejemplo 4
(3
+ 2i)(4 + Si) = (3 ' 4 2 ' 5 ) + (3 . 5 + 2 '4)i
= 2 + 23i
-
(4-i)(2-32)=[4.2-(-1)(-3)]+[(4)(-3)+(-1)(2)]i
= 5 - 14i
i 2 = ( O + i j ( O + i j = ( O ~ O - 1 ~ 1 ) + ( O ~ 1 + 1 ~ O ) i =- 1 A
Se deja como ejercicio comprobar las siguentes reglas de aritmética compleja:
ZI
+ z 2 = z2 + z,
z1z2
ZI
=z2z*
+ (z2 + z3 j = ( z *+ z 2 )+ z3
Zl(ZZZ3j =
z1(z2
(z1z2)z3
+ Zj) = ZlZ2 + z,z3
o+z=z
z+(-z)=O
l.z=z
Estas reglas permiten multiplicar números complejos sin necesidad de aplicar &rectamente la fórmula (4). Siguiendo el procedimiento usado para originar
esta fórmula, basta multiplicar cada término de a + bi por cada término de c + di,
hacer i2 = - 1 y simplificar.
Ejemplo 5
(3
(5
i(I
+ 2i)(4 + i) = 12 + 3i + 8i + 2i2 = 12 + 1 l i 2 = 10 + 1 l i
4i)(2 + 32) = 10 + 15i i $i2 = 10 + 14i + $ = 9 + 14i
+ i)(I 2i) = i(1 2i + i - 2i2) = i(3 i) = 3i i2 = 1 + 3i
-
-
-
-
-
-
-
-
A
1O.1 Números complejos / 607
OBSERVACI~N. A diferencia de los números reales, en los números complejos no
existe ordenamiento según el tamaño. Así, los símbolos de orden <, 5 , > y no se
usan con números complejos.
Ahora que ya se han definido la ahción, la sustracción y la multiplicación
de números complejos, es posible sumar, restar y multiplicar matrices con elementos complejos y multiplicar una matriz por un número complejo. Sin entrar en detalles, se observa que las operaciones y terminología matriciales analizadas en el
capítulo 1 se cumplen sin ningún cambio para matrices con elementos complejos.
Ejemplo 6 Si
entonces
AB=[
=
-i][
[
I+i
4 2- i- 3 i
'qi]
+
!.i+(-i).(2-3i)
1 . ( 1 - i) ( - i ) . 4
(1 +i).(l
-i)+(4-i).4
(I + i ) . i + ( 4 - i ) . ( 2 - 3 i )
=[
-3-i
4-13i
1 -5i
18-4i
EJERCICIOS DE LA SECCION 10.1
1. En cada inciso, graficarel punto y trazar el vector que corresponde al número complejo
dado.
a) 2
+ 3i.
b) 4.
c) -3
2. Expresarcadanúmerocomplejo
reales.
- 2i.
d) -Si.
del ejercicio 1 como un parordenadodenúmeros
3. En cada inciso, usar la mformación proporcionada para encontrar los números reales x
YY.
a) x - i y =
-2+3i
b) ( x + y ) + ( x - y ) i = 3 + i
4. Dado que z , = 1
a) z+, z ,
- 2i y z2 = 4 + S i , encontrar
c) 42,
b) z-Iz 2
d) -z2
e) 32, +4z,
f)
2 1
5. En cada inciso, resolver para z.
a) z + ( l - i ) = 3 + 2 i
b) - 5 z = 5 + 1 0 i
c) ( i - z ) + ( 2 ~ - 3 i )-=2 + 7 i
- 9222
608 i Espacios vectoriales complejos
6. En cada inciso, trazar los vectores z,, z2, z , + z2 y z1 - z2.
a) z1 = 3 + i, z2 = 1 4i
b) z , = -2 + 2i, z2 = 4 + 5i
+
7. En cada inciso, trazar los vectores z y k z .
a)z=l+i,k=2
c) z = 4 + 6 i , k = $
b)z=-3-4i,k=-2
8. En cada inciso, encontrar los números reales k , y k2 que satisfagan l a ecuación
a) k l i + k , ( l + i ) = 3 - 2 i
b) k , ( 2 + 3 i ) + k 2 ( l - 4 i ) = 7 + 5 i
9. En cada inciso, encontrar z,z2, z12y z:.
a)
2,
= 3i. z2 =
1
-
b) z, = 4
i
+ 6i,
z, = 2
-
3i
c ) zl = 9(2 + 4i), z2 = i(1 - 5i)
10. Dado que z1 = 2 - 5 i y z, = - 1 - i, encontrar
a) z l - z,z2
11. (1
+ 2i)(4
15. [ (2
17. ( I
-
b) (zl
+ 32,)'
c) [zI+ ( I + z 2 ) I 2
12. (2 - i)(3
6i)2
+ i)(&+ $)I2
16.
+ i + i 2 + i3)'""
d) iz, - z:
+ i)(4
-
2i)
(a+ i) - i a ( l + ai)
18. (3 - 2i)2 - (3
+ 2i)'
19. Sea
Encontrar
a) A + 3iB
b) BA
c) A B
d) B2 - A2
20. Sea
Encontrar
a) A(BC)
b) ( B C ) A
21. Demostrar que
a) Im(iz) = Re(z).
c ) (CA)B2
b) Re(iz) = - Im(z).
d) (1 + i)(AB) + (3 - 4i)A
I O. 1 Números complejos / 609
22. En cada inciso, resolver la ecuación aplicando la fórmula cuadrhtica y comprobar los
resultados sustituyendo las soluciones enla ecuación dada.
a) z2+2z+2=0
b) z2-z+ 1 = 0
23. a) Demostrar que si n es un entero positivo, entonces los únicos valores posibles de in
son 1, -1, i y -i.
b) Encontrar iZso9. [Sugerencia El valor de in se puede determinar a partir del residuo
cuando n se divide entre 4.1
24. Demostrar: Si zlzz = O, entonces zI = O o z2 = O.
25. Usar el resultado del ejercicio 24 para demostrar lo siguiente: Si zzl = zz2 y z # O ,
entonces z1 = zz.
26. Demostrar que para los números complejoszl, z2 y z3
a)
z,+ z2 = z2 + zI
b) z ,
+ (z2+ z3)= (z,+ z2)+ z3
27. Demostrar que para los números complejoszl, zz y z3
4 zlz2= z2zl
b) zl(z2z3)
= (zIz2)z3
28. Demostrar que zl(z2+ z3) = z1z2+ z i t 3para los números complejos
z I ,zz y z3.
29. En mecánica cuántica,a
lsmatrices de Dirac* son
1
0
0
0
O
P= o
o
1
0
0
0
0
O
O
O
0
(
Y
,
=
O - i
i
o
-1
o
o
>
':
(Y,=
-1
O - i
i
0
,
O
O
0
0
CU, =
o
1
o
1
0
0
y
"I
o '
0
0
0
1
0
o
0 - 1
1
0
0
0
0
o
,o
-1
a) Demostrar que p2 = 4= a: = 4 = I,
b) Dos matrices A y B se denominan anticonmui&*vus si AB =
dos matrices de Dirac cualesquiera son anticonmutativas.
0
- BA. Demostrar que
*Paul Adrien Maurice Dirac (1902-1984) fisico teórico inglés que instrumentó una nueva forma
de mecánica cuántica y una teoría que predijo el "espín"de electrón y la existencia de una particula
atómica fundamental denominada positrón. En 1933 fue galardonado con el premio Nobel de fisica
y en 1939, con la medalla de oro de la Royal Society.
61 O / Espacios vectoriales complejos
10.2 MóDULO; CONJUGADO COMPLEJO; DIVISIÓN
~~
El objetivo principal en esta sección es definir la división de números complejos.
CONJUGADOS
ComLEJOs
Seempezaráconalgunasideaspreliminares.
z = a + bi escualquiernúmerocomplejo,entonces
el conjugado de z, denotado por z,(que se lee como"z barra"), se define como
z=a-bi
En palabras, se obtiene invirtiendo el signo
de la parte imaginaria de z.
Geométricamente, t es la reflexión dez con respecto al eje real (figura 1).
i+=n-bi
~~~~
Figura 1
Conjugado de un número complejo.
I
Ejemplo 1
z=i
Z=3-2i
Z= -4+2i
-i
z=4
z=4 A
z=3+2i
z = -4-2i
El últimorenglóndelejemplo
1 ilustrael hecho deque un
númerorealesigual
a suconjugado. Para serprecisos, se puededemostrar
(ejercicio 22) que z = Z si y SÓIO si z es un número r d .
OBSERVACI~N.
Si un número complejo z se considem como un vector en R2, entonces la norma o
longitud de vector
se denomina módulo(o valor absoluto) de z. En pocas palabras:
MÓDULO
Defhicibn.El mddulo de un número complejo z = a + bi, denotado por Iz/ , se
define como
10.2 Módulo; conjugado complejo; división / 611
de modo que el módulo de un número real es simplemente su valor absoluto. Así,
el módulo de z también se llama valor absoluto de z.
Ejemplo 2 Encontrar z si [zl = 3 - 4i.
Solución. Por (1) con a = 3 y b = -4,
(zI
= , / m = J z s = 5 .
El siguiente teorema establece una relación básica entre
i
A
y Izl.
Teorema 10.2.1. Para cualquier número complejo z,
Demostración.
Si z = a + bi, entonces
ZZ = (a
D I V I S I ~ NDE
NÚMEROS
COMPLEJOS
+ bi)(a - bi) = a2- abi + bai - b2i2
= a2 + b2 = 1zI2 0
A continuación se abordará la división de números complejos. El objetivo es
definir la división como la inversa de la multiplicación. Así, si z2 # O, entonces la
definición de z = zl/zz debe ser tal que
El procedimiento será demostrar que (2) tiene una solución única para z si z2 f O,
y luego z1/z2 se definirá como este valor de t.Igual que con los números reales, no
se permite la división entre cero.
Teorema 10.2.2. Si z2
única, que es
f
O, entonces la ecuación (2) tiene una solución
1
z=-zz
1z212
Demostración. Sean z = x
puede escribir como
-
+ i y , z, - x1 + iY1 Y 22 = x2 + iy2. Entonces (2) se
x1
+ iyl = (x2 + iy2)(x+ iy)
612
/
Espacios vectoriales complejos
o bien
x] + i,vl
+ i(y2x + xzy)
= (xzx ---v2y)
o bien, igualando las partes reales e imaginarias.
o bien,
Como z2 = x2 + zy2 f O, se concluye que x2 y y 2 no son cero a la vez, de modo que
Así, por la regla de Cramer (teorema 2.4.3), el sistema (4) tiene la solución ímica
Por tanto,
Así, para z2 f O se define
I
10.2 Módulo; conjugado complejo; división / 613
OBSERVACI~N. Para recordar esta fórmula, multiplicar por Z el numerador y el
denominador de z,/z2:
Ejemplo 3 Expresar
3 + 4i
1 -2i
en laforma a + bi.
Solución. Por ( 3 ,con z1 = 3 + 4 i y z2 = 1 - 2i,
3 + 4i
1 - 2i
1
11
"
-
(3
1
5
- 2iI2
=-(-5+
+ 4i)( 1
1
-
2i) = - (3 + 4i)( 1
5
+ 2i)
1Oi)= - 1 + 2 i
Otra solución. Así como en la observación precedente, el numerador y el
denominador se multiplican por el conjugado del denominador:
3 +4i
1 -2i
-
+
3 +4i 1 +2i -5
1Oi
= -I+2i
5
1 -2i 1 +2i
A
Los sistemas de ecuaciones lineales con coeficientes complejos se presentan
en vanas aplicaciones. Sin entrar en detalles, se observa que los resultados sobre
sistemas lineales estudiados en los capítulos 1 y 2 se cumplen sin cambio para
sistemas con coeficientes complejos.
Ejemplo 4 Aplicando la regla de Cramer, resolver
ix
+ 2y = 1 - 2i
4x-iy= -1 +3i
614 / Espacios vectoriales complejos
Y=
1' -'"'I
;1 -21
Así, la solución es x = i , y
- (i)(-1 +3i)-4(1
i( - i) - 2(4)
=
- 2 i ) -" -7+7i
-1-i
-7
1 - i. A
PROPIEDADESDE Esta sección concluye con la enumeración de algunas propiedades del conjugado
LOS NÚMEROS
complejoqueserándeutilidad
en seccionesulteriores.
COMPLEJOS
Teorema 10.2.3. Para números complejos cualesquiera z, z1y Z2
a)
b)
Z]
+ z,
m
= 2,
+ z2
1
"
= Z,
- z2
Se demostrará el inciso a) y lo demás se deja como ejercicio.
Demostración de a). Sean z1 = al
z1
+ b,i y z2 = u2 + b2i; entonces
+ z2 = (al + a z ) + (b, + b,)i
= (a, + a 2 )- (b, + b2)i
= (a, - b,i)
=
z, + z, 0
+ (u2- b,i)
Es posible ampliar el inciso a) del teorema 10.2.3 a n términos y
el inciso c) a n factores. En pocas palabras,
OBSERVACI~N.
z,+z2+.~~+z,=z,+z2+~'~+~,
Z]Z2.
. . z,
"
= z,z*.
. .Z"
EJERCICIOS DE LA SECCIÓN 10.2
1. Encada inciso hallar
.
a ) z = b2 )+z7=i -c3) -z5=i 5 i
2. En cada inciso encontrar IzI.
a)z=i
b)z=-7i
c)z=-3-4i
d)z=-i
d)z=l+i
e ) z = -9
e)z=-8
f)z=0
f)z=O
1 O. 2 Módulo; conjugado complejo; división / 615
3. Comprobar que z
a) z = 2 - 4 i
= kl2para
c) z=*-V%
b) z -=3 + 5 i
4. Dado que z, = 1 - 5i y zz = 3 + 4i, encontrar
b) 5,/z2
a) zI/zz
c) z l / &
e) zl/lzzl
d) (z1/z2)
f) Iz,/z21
5. En cada inciso, encontrar l/z.
b) z = 1 -5i
a) z = i
c) z = -
-i
7
6. Dado que z, = 1 + i y zz = 1 - 2i,encontrar
En los ejercicios del 7 al 14, realizar los cillculos y expresar el resultado en la forma a + bi.
i
I+i
7. 10.
13.
8.
2+i
i( - 3 4i)
11.
+
i
(1 - i)(l
2+i
14.
- 2i)(l + 2i)
2
(1 - i)(3 + i )
1
____9. ___
V3+i
(1
- i)(V3 - i)
1-2i
3 + 4i
(3
12.
+ 4)’
1
i(3 - 2i)(l
+ i)
5i
15. En cada inciso, resolver para z.
a) iz = 2 - i
b) (4 - 3i)F =
16. Aplicar el teorema 10.2.3 para demostrar las siguientes identidades:
a) z+=z-Si
b)
-
z= -iZ
i+Z
c) -=
I-z
-1
17. En cada inciso, trazar el conjunto de puntos enel plano complejo que satisfacen la
ecuación.
a) I z ( = 2
b) l z - ( l + i ) / = 1
c) Iz - i ( = ( z + i (
d) I m ( Z + i ) = 3
18. En cada inciso, trazar el conjunto de puntos en el plano complejo que satisfacen la(s)
condición (condiciones)dada(s).
a) Iz
+i l s 1
19. Dado que z = x
a) Re(G)
b) 1 < bl < 2
c) (2z - 4il < 1
d) JzI5 )z
+ iJ
+ Q, encontrar
b) Im(c)
c) Re(i5)
d) Im(i5)
20. a) Demostrar que si n es un entero positivo, entonces los únicos valores posibles de
(1li)”son 1, - 1 , i y -i.
b) Calcular ( l/i)2s09. [Sugerencia.Véase el ejercicio 23(b) de la sección 10.1,]
616 / Espacios vectoriales complejos
21.Demostrar:
1
I
bj -(z - 5) = Im(zj
+ Z ) = Re(z)
a) -(z
2
2i
si y sólo si z es un número real
22. Demostrar: z =
23. Dado que z, = x, + iyl y z2 = x2 + 'y2,encontrar
24. Demostrar: Si
(i)2= 2,entonces z es real o imaginario puro.
25. Demostrar que Iz; = j
1
26. Demostrar:
a)
"
z,
-
z, = z I - z2
-
= I,:,
b)
c) (zl/z2) = Z,/Z2
d)
=z
-
27. a) Demostrar que z 2 = (i)2.
-
b) Demostrar que si n es un entero positivo, entonces Z " = ( 1j".
c) ¿Es verdadero el resultado del inciso b) si n es un enteronegativo?Explicarla
respuesta.
En los ejercicios del 28 al 31, resolver el sistema de ecuaciones lineales aplicando la regla
de Cramer.
29. x, + x 2 = 2
x , - x2 = 2i
28. ix, - ix, = - 2
2x, x2 = i
+
+
30. xI x, + x3 = 3
x, x, - x j = 2 2i
x, --,+x,=
-1
31. ix,
x,
+
+
XI
+ 3x, + (1 + i)x3 = - i
+ ix, + 3x, = -2i
+ x, +
xj = o
En los ejercicios 32 y 33, resolver el sistema de ecuaciones lineales por eliminación de
Gauss-Jordan.
32.
[
- l"
+i
" -2
-i][~~]=
[:]
33.
[
"If2
"[;;]=[:I
1
34. Resolver el siguiente sistema de ecuaciones lineales por eliminación de Gauss-Jordan
x, + ix,
+ (1 i)x, + 2ix3 = O
+ ( - I + 2i)x, - 3ix3 = O
-x1
2x,
- ix, = O
-
10.3 Forma polar; teorema de De Moivre / 61 7
35. En cadainciso, aplicar la fórmuladelteorema
1.4.5 paracalcularlainversadela
matriz y comprobar el resultado demostrandoque AA - = A - ' A = I.
'
36. Sea&) = a. + alx + a,x2 + . . . + anX"un polinomio en el que los coeficientes a,,,a , ,
a2, . . . , an son reales. Demostrar que si z es una soluci6n de l a ecuación p ( x ) O,
entonces también
lo es.
37. Demostrar: Para cualquier número complejo z,IRe(z)l 5 Izi e IIm(z)l
5
Iz/.
38. Demostrar que
IRe(z)l + IIm(z)l
~
v5
[Sugerenciu Sea z = x
+ iy y aplicar el hecho de que (bl - b1)22 O.]
39. En cada inciso aplicar el método del ejemplo 4 de la sección 1.5 para encontrar A"
comprobar el resultado demostrando que AA"
y
= A"A = 1.
i
O
2-i
i
-i
10.3 FORMA POLAR; TEOREMA DE DE MOIVRE
En esta sección se analizará una forma para representar números complejos
usando propiedades trigonométricas. El trabajo efectuado conducirá a una
fórmula fundamental para potencias de números complejos y a un método para
encontrar raíces n-ésimas de números complejos.
FORMA POLAR
DE UN NúMERO
COMPLEJO
Figura 1
Si z = x + iy es un número complejo diferente de cero, r = (z(y 8 mide el ángulo
entre el eje real positivo y el vector z, entonces, como se sugiere en la figura 1,
618 / Espacios vectoriales complejos
de modo que z = x + iy se puedeescribir como
z=rcos e+irsenB
o bien, como
I
I
Esta expresión se denominaforma polar de z.
ARGUMENTO DE
UN NúMERO
COMPLEJO
El ángulo 8 se denomina argumento de z y se denota por
e = arg z
El argumento de z no está determinado de manera única porque se puede sumar o
restar a 8 cualquier múltiplo de 2z para obtener otro valor del argumento. Sin
embargo, sólo existe un valor del argumento en radianes que satisface
Esta expresión se llama argumento principalde z y se denota por
e = Arg z
Ejemplo 1 Expresar los siguientes números complejos en forma polar usando sus
argumentos principales:
(a)z=l+d%
b)z=-1-
I
Solución de u). El valor de r es
r = \ z l = w = + T = 2
ycomox= l y y = fi,por(l)seinfiereque
10.3 Forma polar; teorema de De Moivre
/
619
así, cos 8 = 112 y sen O = 6 1 2 . El Único valor de O que satisface estas relaciones
y cumple elrequisito - n < 8 In es O = n/3 (= 60") (véase la figura 2a).
Entonces, una forma polar de z es
Solución de h). El valor de r es
1 -i
- 1 = *COS
e
- 1 = *sene
de modo que cos O = - 1f f i y sen O = - 11f i . El Único valor de que satisface
estas relaciones y cumple el requisito - n e 8 5 n es O = - 3 ~ 1 4 (= - 135')
(figura 26). Por tanto, una forma polar de z es
-+isenINTERPRETACIÓN
GEOMÉTRICA
DE LA
MULTIPLICACIÓN Y LA
DMSIÓN
"1
4
A
A continuación se mostrará cómosepueden usar las formas polares para obtener
interpretaciones geométricas de la multiplicación y la división de números
complejos.
Sean
z, =?,(cos 0,
+ i sene,)
y
z2 = r,(cos 6,
+ i sen e,)
Multiplicando,
obtiene
se
Z,Z,
= r,r2[(cos-0,COS
e,
-sene, sene,)
+ i(sen0, cos 0, + C O S e, sene,)]
620 / Espacios vectorialescomplejos
Recordando las identidades trigonométricas
cos(8, + O,)
sen(0, + 8,)
=
cos S, cos O, - sen 8, sen S,
= sen O,
cos S,
+ cos 8, sen 8,
Se obtiene
zlz2= r,r,[cos(S, + O , )
+ isen(8, + O,)]
que es una forma polar del número complejo con módulo
rlrz y argumento
8, +- 8,. Así, se ha demostrado que
lv21
= IZllIZ2l
Y
arg(z,z2) = arg z1 + arg z2
(¿Por qué?)
En palabras, el productode dos números complejos se obtiene al multiplicar
sus módulos y sumar sus argumentos (figura 3).
Figura 3
Producto de dos números complejos.
I
Se deja como ejerciciodemostrar que si z2 # O , entonces
~~
a partir de lo cual se concluye que
1O. 3 Forma polar; teorema de De Moivre / 621
Y
arg
k)
= arg z1 - arg z2
En palabras, el cociente de dos números complejos se obtiene al dividir sus
módulos y restar sus argumentos (en el orden adecuado).
Ejemplo 2 Sean
Las formas polares de estos números complejos son
(comprobar), de modo quepor (3)
zlzz =4[cos(t+:)
=4
[ y
+isen('+:)]
-1
c o s - + i s e n=
- 4[O+i]=4i
2
T
T V 3 1
=cos-+isen-=--+--i
6
6
2
2
Como comprobación, zlz2 y z1/z2 se calcularán directamente sin usar las formas
polares dez1 y z2:
.- .
.
622
/
Espacios vectoriales complejos
lo cual concuerda con el resultado previo. A
El número complejo i tiene módulo 1 y argumento n / 2 = (90"), por
tanto, el productoiz tiene el mismo módulo que z, pero su argumento es 90" mayor
que el de z. En resumen, al multiplicar z por i gira en sentido contrario a las
manecillas del reloj por un ángulo de 90" (figura 4).
t'
Figura 4
FÓRMULA DE
DE M O W
I Al multiplicar por i,
z gira 90' en sentido contrario a las manecillas del reloj.
I
Si n es un entero positivo y z = r(cos O + i sen e ), entonces por la fórmula (3),
-
.~=r"[cos(8+8+...+8)+isen(8+8+...+8)]
n factores
n términos
n términos
Z"=Z.Z.t..
o bien,
z" = r"(cos no
+ isen ne)
Además, si z f O, se define z-" = l/z".
En el caso especial en que r = 1, se tiene z = cos O + J sen O, de modo que (6)
se convierte en
(cos 8
+ i seno)" F cos n8 + i sen no
expresión que se denomina fórmula de De Moivre*. Aunque (7) se obtuvo suponiendo que n es un entero positivo, en los ejercicios se demostrará que esta fórmula esválida para todos los enteros n.
*Abraham De Moivre (1667-1754) matemáticofrancés que realizóimportantescontribucionesa
probabilidad, estadísticay trigonomehia. Desarrollóel concepto de eventos estadísticamente independientes,
escribió un tratado hndamentalsobre probabilidady ayudó a transformar la trigonometría de unarama de
lageometríaauna
rama del análisis a través del empleo de los númeroscomplejos. A pesar de su
importante trabajo, a duras penasse a
¡sarreglaba paravivir como tutor y asesor sobre juegos y seguros.
1O. 3 Forma polar; teorema de DeMoivre / 623
DETERMINACI~N
DE LAS
RAICES
n-ÉSIMAS
A continuación se mostrará cómo usar la fórmula de De Moivre para obtener
raíces de números complejos.Si n es un entero positivo y si z es cualquier
número complejo, entonces la raíz n-ésima de z se define como cualquier número complejo w que cumple la ecuación
Una raíz n-ésima de z se denota por zlln. Si z # O, entoncesa
ls fórmulas
para las raíces n-ésimas zdese pueden obtener como sigue. Sean
w=p(cosa+isena)
y
z=r(cosO+isen8)
Si se supone quew satisface (8), entonces por(7) se concluye que
pn(cos n a
+ i sen na) = r(cos 8 + i sen 8)
(9)
Al comparar los módulos delos dos miembrosse observa quep = r o bien, que
6denota la n-ésima raíz real positiva de r. Además, para que en (9) se
donde "
cumplan las igualdades cos
n a = cos 8 y sen n a = sen 8, los ángulos n a y 8 deben
ser igualeso diferir por un múltiplo de2n. Es decir,
n a = 8 + 2 k r ,k = 0 ,
+ 1 , t 2, . . .
O
8
a=-+-
n
2!cr
,
n
k=0, k l , 2 2 , .
Así, los valoresde w = p (cos a + i sen a) que satisfacen(8) están dados por
w=('h[cos(!+~)+isen(~+~)],
k=0, k l , k2, . . .
Aunque hay muchos valores de k, se puede demostrar (ejercicio 16) que k = O , 1,
1 producen valores distintos de w que satisfacen (8), y que todasa
ls
d e b elecciones dek producen réplicas de esos valores.En consecuencia, existen
exactamente n diferentes raícesn-ésimas de z = r(cos 8 + i sen e), y están dadas
por
2, . . . , n
-
= l / n = , [ , , s ( 8, t ~2km
)+iSen(!+~)],
k=O,1,2,,..,n-l
(IO)
624 / Espacios vectoriales complejos
Ejemplo 3 Encontrar las raíces cúbicas de -8.
Solución. Como -8 está sobre el eje real negativo se puede usar 0 = ?t como
argumento. Además, r = bl = 1-81 = 8, de modo que una forma polar de -8 es
-8=8(cos v+isen.rr)
Por (10) con n = 3 se deduce que
[ (3-+cos
25") + i s e n
(3-+-
2 3 ] ,
k = O , 1,2
Así, las raíces cúbicas de -8 son
2(cos7r+isen7r)=2(-1)= -2
Como se muestra en la figura 5, las tres raíces cúbicas de -8 obtenidas en el
ejemplo 3 son equilstantes, ya que están separadas por una lstancia de n13
radanes (= 120') sobre la circunferencia de radio 2 con centro en el origen. Este
hecho no es fortuito. En general, por la fórmula (10) se concluye que las raíces nésimas de z están sobre la circunferencia de radio "&(=.fi)y
son equidstantes,
separadas por una distancia de 2 nln radianes. (¿Puede el lector darse cuenta de
por qué esto es así?) Así, una vez que se ha determinado una raíz n-ésima de z, las
demás n - 1 raíces se pueden generar si esta raíz se hace girar sucesivamente en
incrementos de 2 nln radianes.
4'
Figura 5
Las raíces cúbicas de -8.
I O. 3 Forma polar; teorema de De Moivre / 625
Ejemplo 4 Encontrar las raíces cuartasde 1.
Solucidn. Se podría aplicar la f6miila i.U.:¡ j . 1.c. vez de ello, se observa quew = 1
es una raíz cuarta de 1, de modo que las tres raíces restantes se pueden generarsi
esta raíz se hace girar en incrementos de
2 d 4 = n/2 radianes (= 90'): En la
figura 6 se observa quelas raíces cuartasde 1 son
1. i, -1, "i
A
4"
/
/
EXPONENTES
COMPLEJOS
\
\
Estasecciónconcluyeconalgunoscomentariossobrenotación.
En estudios
más
detallados
de
números
complejos
se
definen
los
exponentes
complejos y se demuestra que
I
o+
cos
i sen8=eie
donde e es un número real irracional definido aproximadamente por e =
2.7 1828. . . (Para quienes ya estularon Cálculo, en el ejercicio18 se proporciona
una demostración de este hecho.)
Por la expresión(1 1) se concluye que la forma polar
z = r(cos 8
+ i sen 8)
se puede escribir de manera
más breve como
Ejemplo 5 En el ejemplo 1 se demostró que
626 i Espacios vectoriales complejos
Por (12), la expresión anterior también puede escribirse como
Es posible demostrar que los exponentes complejosobedecen las mismas
reglas que los exponentes reales, de modo que si
z1 = rleiBl
Y
z2= r2ei*2
son números complejos diferentes de cero, entonces
Pero estas son justamente l a s fórmulas (3) y (5) escritas en otra notación.
Por ultimo, se obtendrá una fórmula útil para expresar 2en notación polar.
Si
z
= rei* = r(cos
O
+ i sen e)
entonces
Z = r(cos 9 - i sene)
Recordando las identidades trigonométricas
sen(- O) = -sen 0
y
COS(
la expresión (13) se puede volver aescribir como
o bien, de manera equivalente,
-
e) = COS e
10.3 Forma polar; teorema de De Moivre
EJERCICIOS DE LA SECCIóN 10.3
1. En cada inclso, encontrar el argumento principal de z.
a)z=l
b)z=i
d ) ze=) lz+=i- l + d ? i
c)z=-i
2. En cada inciso hallar el valor de O = arg( 1
b) - a < O s a
a) O<O'2a
f)z=l-i
-
hi)que satisface la condicióndada.
c)
--SO<--
rr
6
1l a
6
3. En cada inciso expresarel número complejo en forma polar usando
su argumento principal.
a) 2i
b) - 4
c) 5 + 5 i
4. Dado que z, = %(cosn14
d) - 6 + 6 d ? i
e) - 3
-
3i
f) 2 f i - 2 i
+ i sen n / 4 )y z2 = COS nl6 + i sen n16) obtener una forma
polar de
5. Expresar z, = i, z2 = 1
-
f i i y z3 =
&+ i en forma polar y aplicar los resultados para
encontrar z,z2/z3.Comprobar los resultados efectuando los cálculos sin usar formas polares.
6. Usar la fórmula (6) para hallar
7. En cada inciso, encontrar todasa
lsraíces y trazarlas como vectores en el plano complejo.
b) (1
a) (-i)'12
+ V'%)'12
c)
(i)'I3
d)
e) ( -
f) ( - 8
8. Usar el método delejemplo 4 para encontrar todas las raíces cúbicas de 1
9. Usar el método del ejemplo 4 para hallar las raíces sextas de l .
10. Obtener las raíces cuadradas de 1 + i y expresar los resultados en forma polar.
11. En cada inciso encontrar las soluciones de la ecuación.
a)
z4 - 16 =
O
b) z4I3 = - 4
12. Calcular cuatro soluciones de la ecuación fi + 8 = O y con los resultados, factorizar z4 +
8 en dos factores cuadráticos con coeficientes reales.
+ 8V3i)1/4
I'
627
628
i
Espacios vectoriales complejos
14. En cada inciso, usando (6), calcular la potencia indicada
a) ( I
+I)'
b) (-2*+2i)")
15. En cada inciso, encontrar Re@) e h ( z ) .
16. a) Demostrar que todos los valores de
en la fórmula (10) son diferentes.
b) Demostrar que los valores enteros de k distintos de k = O, 1,2, . . . ,n - 1 producen
valores de z"" que son réplicas de los producidos por la fórmula (IO).
17. Demostrar que la fórmula (7)es válida si n = O o r~ es un entero negativo.
18. (Para quienes ya estudiaron Cdkulo). Para demostrar la fórmula (1 l), recuérdese l a
serie de Maclaurin para 8
a) Sustituyendo X = i o en esta serie y simplificando, obtener la fórmula
b) Usando el resultado del inciso a), obtener (1 1)
19. Obtener la fónnula (5)
10.4
ESPACIOS VECTORIALES COMPLEJOS
PROPIEDADES
BASICAS DE LOS
ESPACIOS
VECTORIALES
COMPLEJOS
En espacios vectorides complejos, las combinaciones lineales se definen
exactamente como en los espacios vectoriales reales, excepto que los escalares son
complejos. En pocas palabras, un vector w se denomina combinación lineal de los
vectores vl, v,, . , v,. si se puede expresar en l a forma
, ,
+
w = k,v, k2v2 + . . .
donde k,, k,, . . . , kr son números complejos.
+k,~,
1O. 4 Espacios vectoriales complejos / 629
Los conceptos de independencia lineal, conjunto generador, base, dimensión y subespacio permanecen sin ningún cambio para espacios vectoriales complejos, y los teoremas obtenidos en el capítulo 5 siguen siendo válidos.
El espacio vectorial real más importante es R", que es el espacio de n-adas
de números reales, donde la adición y la multiplicación escalar se efectúan por
coordenadas. El espacio vectorial complejo más importante es C", que es el espacio de n-adas de números complejos, donde la adición y la multiplicación escalar
se efectúan por coordenadas. Un vector u en C" se puede escribir en notación
vectorial
o en notación matricial
donde
u, = a ,
+ b,i,
u2 = a ,
+ h,i,
. . . , u, = a,
+ h,i
Ejemplo 1 Si
u = (i, 1
+ i, -2)
y
v = ( 2 + i, 1 - i, 3 + 2i)
entonces
u+v
= (i, 1
+ i,
-2)
+ ( 2 + i, 1 - i, 3 + 2i) = (2 + 2i, 2, 1 + 2i)
Y
i u = i ( i , 1 + i , - 2 ) = ( i z , i + i 2 , - 2 i ) = ( - 1 , - 1 ti,-2i) A
En C n , así como en R", los vectores
e , = ( 1 , 0 , 0 , . . . , O), e,=(0,
1,0, . . . , O),
. . . , en=(O,O,O,
forman una base. Ésta se denomina base estúndar para
n vectores, Cn es un espacio vectorial n dimensional.
. . . , 1)
P.Como en esta base hay
No se debe confundir el número complejo i = &
con
i el vector i
= (1, O,O) de la base estándar para R3 (véase el ejemplg 3 de la sección 3.4). El
número complejo i siempre se escribirá en cursivas y el vector i, en negritas.
OBSERVACI~N.
630 i Espacios vectoriales complejos
Ejemplo 2 En el ejemplo 3 de la sección 5.1 se definió el espacio vectorial M,,,, de
matrices m X n con elementos reales. El análogo complejo de este espacio es el
espacio vectorial de matrices con elementos complejos y las operaciones de adición
de matrices y multiplicación escalar. Este espacio se denomina complejo M,,,,,. A
Ejemplo 3 Si fi(x) y fz(x) son funciones con valores reales de la variable x,
entonces la expresión
se denomina función con valores complejos de la variable x. Algunos ejemplos
son
f(x) = 2x + ix3
y
g(x>= 2 sen x
+ i cos x
(1)
Sea Vel conjunto de las funciones con valores complejos que están definidas sobre
la recta. Si f = fi(x) + iJ2(x) y g = gl(x) + ig2(x) son funciones como las
mencionadas y k es cualquier número complejo, entonces la función suma f + g y
el múltiplo escalar kf se definen por
Se puede demostrar que V junto con las operaciones establecidas es un espacio
vectorial complejo. Se trata del análogo complejo del espacio vectorial F(- m, m)
de funciones con valores reales analizado en el ejemplo 4 de la sección 5. l . A
Ejemplo 4 (Para quienes ya estudiaron Crilculo). Si Ax) =S,(.) + &(x) es una
función con valores complejos de la variable real x, entonces se dice que f es
continua si f , ( x ) y f2(x) son continuas. Se deja como ejercicio demostrar que el
conjunto de todas las funciones continuas con valores complejos de una variable
real x es un subespacio del espacio vectorial de todas las funciones con valores complejos de x. Este espacio es el análogo complejo del esuacio vectorial
I O. 4 Espacios vectoriales complejos / 63 I
C(-m, 00) analizado en el ejemplo 7 de la sección 5.2 y se denomina cornplejo C(- 00, m). Unejemplo bastante relacionado es el complejo C[a, b], el
espacio vectorial de todas las funciones con valores complejos que son continuas
sobre el intervalo cerrado [a, b ] . A
Recuérdese que en R" el producto interior euclidiano de dos vectores
se definió como
y que la norma (o longitud) euclidiana de u se definió como
llull = (u u)l'2 =
vu:+
u;
+ . . + u;
'
Desafortunadamente, estas definiciones no son apropiadas para vectores en C".
Por ejemplo, si (3) se aplicase al vector u = (z, 1) en C2, se obtendría
((u(\
=
VFZ = v% = o
de modo que u sena un vector dverente de cero con longitud cero, situación a
todas luces contradictoria.
PRODUCTOS
INTERIORES
EUCLIDIANOS
COMPLEJOS
Para extender correctamente los conceptos de norma, distancia y ángulo a C" es
necesario modificar un poco el producto interior.
~~
~
~
~
~
~
~~~~
Definicih. Si u = ( u l , u2, . . . , un) y v = ( v l , v2, . . . , vn) son vectores en Cn,
entonces su producto interior euclidiano complejo u * v se define por
donde i
1' 2'""
inson los conjugados de vl,v2, . . . ,vn.
Nótese que el producto interior euclidiano de vectores en C" es
un número complejo, mientras que el producto interior euclidiano de vectores en
Rn es un número red.
OBSERVACI~N.
Ejemplo 5 El producto interior euclihano complejo delos vectores
632 / Espacios vectoriales complejos
u=(-ii,2, 1 +3i)
y
v = ( l -i,O,
I +3i)
es
+ (2)(0) + (1 + 3i)(l + 32)
+ i) + (2)(0) + (1 + 3i)(l - 3i)
u - v = (-i)(l - i)
= (-i)(l
-
- i - 22 + 1 - 9'2
I z I 1 - i
A
En el teorema 4.1.2 se mencionaron las cuatro propiedades principales del
producto interior euclidiano sobre Rn. El siguiente teorema es el resultado
correspondiente para el producto interior euclidiano complejo sobre C n
Teorema 10.4.1. Si u, v y w son vectores en C? y k es cualquier número
complejo, entonces:
a)
b)
c)
d)
u.v=v.U
(u+v).w=u.w+v.w
(ku).v = k(u.v)
v.v?O.Ademas,v.v=O
siysófosi v=O.
Obsérvese la diferencia entre el inciso a) de este teorema y el inciso a ) del
teorema 4.1.2. Se demostrarán los incisos a ) y d) y los demás se dejan como
ejercicio.
Demostración de a).Sean u = (ul, u2, . . . , un) y v = ( v , , v2, . . . ,v,). Entonces
Y
v. u = U I U I + U2ü2-t .
'
'
+ unü,
de modo que
v.u
= UIUl
-
= ulul
+ u2u2
- + ' . . + Unün
+
+-
' ' '
VnUn
+ ü*uz+ . . . + Ü,,un
= U l Ü l + u2ü2+ . . + unü,
'
=
u.v
[Teorema 10.2.3, incisos a) y c)]
[Teorema 10.2.3, inciso e)]
I O. 4 Espacios vectoriales complejos / 633
Demostración de 4.
Además, la igualdad se cumple si y sólo si lvll = Iv21 = . . . = lvnl = O. Pero esto es
cierto si y sólo si v1 = v2 = . . . = v, = O, es decir, si y sólo si v = O. 0
OBSERVACI~N.
Se deja como ejercicio demostrar que
u (kv) = k(u .v)
para vectores en C". Hacer la comparación con la fórmula correspondiente
.
u . (kv) = k(u v)
para vectores en R".
NORMA Y
DISTANCIA EN
Por analogía con (3), la normaeuclidiana (o longitud euclidiana) de un vector u
= (u1, uz, . . . , un) en Cn se define por
P
y la distancia euclidiana entre los puntos u = (u1, uz, . . . , un) y v = ( v l ,v2, . . . ,
vn) se define por
Ejemplo 6 Si u = (i, 1 + i, 3) y v = (1 - i, 4, 4i), entonces
llull
=m=2v3
Y
d(u, v)
=
VIi - (1 - i)I2+ 1(1 + i) - 212 + 13 - 4iI2
= ~ I - 1 + 2 i ) 2 + I - 1 + i ( 2 + 1 3 - 4 i ( 2 = ~ 5 + 2 + 2 5 = ~ =A4 ~
El espacio vectorial complejo Cn con la norma y el producto interior antes defihdos se denomina espacio n euclidiano complejo.
634
,/
Espacios vectoriales complejos
EJERCICIOS DE LA SECCIóN 10.4
1. S e a n u = ( 2 i , 0 , - 1 , 3 ) , v = ( - i , i , 1 + i , - l ) y w = ( l + i , - i , - 1 + 2 i , O ) . E n c o n t r a r
a) u - v
b) i v f 2 w
d) 3 ( u - ( I + i ) v )
c) - w + v
e) - i v + 2 i w
f) 2 v - ( u + w )
2. Sean u, v y w los vectores del ejercicio 1. Encontrar el vector x que satisface
u - v + ix = 2ix + w.
3.
Sean u, = (1 - i , i, O), u2 = (22, 1 + i, 1) y u3 = (O, 22, 2 - i). Encontrar escalares c,,
que c,u, + c2uz + c3u3= ( - 3 + i, 3 + 2i, 3 - 4i).
cz y c3 tales
4. Demostrar que no existen escalares c,, c2 y c3 tales que
c,(i, 2 - i, 2
+ i) + c2(1+ i, -2i, 2) + 4 3 , i, 6 + i) = (i, i, i)
5. Encontrar la norma euclidiana de v si
a) v = ( l , i )
b) v = ( l + i , 3 i , 1)
c) v = ( 2 i , 0 , 2 i + 1, - 1 )
d) v = ( - i , i , i , 3 , 3 + 4 2 )
6. Sean U = (3i,O, -i), v = (O, 3 + 44 -2i) y w = (1 + i, 22, O), Encontrar
d) 113~- 5~ + wI I
1
e ) -w
llwll
7. Demostrar que si v es un vector diferente de cero en Cn, entonces (l/llvll)v tiene noma
euclidiana l .
8. Encontrar todos los escalares k tales que I l k v l l = 1, donde v = (32,4i)
9. Encontrar el producto interior euclidiano u * v si
a) u = (-i, 3i), v = (3i,2i)
b) u = (3 - 4i, 2 i, -6i), v = (1
+
+ i, 2 - i, 4)
c) u = ( l - i , l + i , 2 i , 3 ) , v = ( 4 + 6 i , - 5 , - 1 + i , i )
En los ejercicios 10 y 11 se proporciona un conjunto de objetos junto con las operaciones
de adición y multiplicación escalar. Determinar cuáles conjuntos son espacios vectoriales
complejos bajolas operaciones dadas. Para los que no lo sean, mencionar todos los axiomas
que no se cumplen.
10. El conjunto de todas las temas de números complejos (z,, z2, z3) con las operaciones
Y
10.4 Espacios vectoriales complejos / 635
11. El conjunto de todas las matncescomplejas de 2 X 2 de la forma
con las operaciones matmiales normales de adición y multiplicación escalar.
12. ¿Es Rn un subespacio de Cn? Explicar la respuesta
13. Aplicando el teorema 5.2.1, determinar cuáles de los siguientes
conjuntos son subespacios de C3.
a) Todos los vectores de la forma (2, O, O).
b) Todos los vectores de la forma (z, i, i)
c) Todos los vectores de la forma (zl, z2, z3), donde z3 = z1 + z2.
d) Todos los vectores de la forma (zl, z2, z3),donde z3 = z1 -t z, + i.
"
14. Aplicando el teorema 5.2.1, determinar cuáles de los siguientes conjuntos son subes-
pacios del complejoMZ2:
a) Todas las matnces complejas de la forma
donde z1 y z2 son reales.
b) Todas las matrices complejas de la forma
donde z1 + z4 = O.
c) Todas las matricescomplejas A 2 X 2 tales que
= A , donde 2 es lamatriz
cuyos elementos son los conjugados de los elementos correspondientes de A.
15. Aplicando el teorema 5.2.1, determinarcuálesde
los siguientes conjuntos son subespacios del espacio vectorial de las funciones con valores complejos de la variable
real x:
a) Todas lasf tales queA1)= O.
b) Todas lasftales queA0) = i . c) Todas las f tales quef(-x) = f ( x )
d) Todas las f de laforma k , + k2 elx, donde k , y k, son números complejos.
16. ¿Cuáles de los siguientes vectores son una combinación lineal de u = (i, -i, 32) y v =
(2i, 4i,O)?
a) (3i,3i, 3i)
b) (442i, 6i)
c) (i, 5i, 6i)
d) (O, O, O)
17. Expresar cada uno de los siguientes vectores como una combinación lineal de u = (1, O,
- z), v = (1 + i, 1, 1 - 2i) y w = (O, i, 2).
a) (1, 1, 1)
b) (i, O, - i )
C) (O, O, O)
d) ( 2 - i, 1, 1 + i)
18. En cada inciso, determinar si los vectores dados generan a C3
636 / Espacios vectoriales complejos
a) v I = (i, i, i), v2 = (22, 2i, O), v3 = (3i, O, O)
b) V , = ( 1 + i, 2 - i, 3 + i), vi = (2 + 3i, O, 1 - i)
c) V, = (1, O, -i), v2 = (1 + i, 1, 1 - 24, v3 = ( O , i, 2)
d) v I = (1, i , O), v 2 = ( 0 , -i, I), v 3 = ( 1 , O, 1)
19. Determinar cuáles de las siguientes fünciones están enel espacio generado por
f = e”
a) cos x
y
g=e-””
b) sen x
x
c)cos
+ 3i sen x
20. Explicar por qué los siguientes conjuntos de vectores son linealmente dependientes.
(Resolver este problema por inspección.)
a) u , = ( I - - i , i ) y u 2 = ( 1 + i , -1)enC2
b) u, = (1, - i), u2 = (2 + i, - l), u) = (4, O) en C 2
c) A =
[
J
2i
y
’j]
O
=
[
2
0
en el complejo
21. ¿Cuáles de los siguientes conjuntos de vectores en C3 son linealmente independientes?
+
+
= (1 -i, 1, O), u2= (2, 1 i, O), u3 = (1
i, i, O)
b)u,=(I,O,--i), u2=(l+i,l,l-2i), u3=(0,i,2)
c)u,=(i,O,2-i), u2=(0,1,i),n,=(-i,-1-4i,3)
a) u,
22. Sea V el espacio vectorial de todas las funciones con valores complejos de la variable
real x. Demostrar que los siguientes vectores son linealmente dependientes.
f=3
+ 3i cos 2x,
g =sen2 x
+ i cos2 x,
h = cos2 x
- isen* x
23. Explicar por qué los siguientes conjuntos de vectores no son bases para los espacios
vectoriales indicados. (Resolvereste problema por inspección.)
a) u ,
b) u ,
= (i, 2i), u2 = (O, 32), u3 = (1, 7i) para C’
= ( - 1 i, O, 2 - i). u2 = (1, -i, 1 i) para C3
+
+
24. ¿Cuáles de los siguientes conjuntos de vectores son bases para C2?
b) (1 + i, l), (1 + i, i )
d) (2 - 32, i), (3 + 2i, - I )
a) (2i, -i), (4i, O)
c) (O,O), (1 + i, 1 - i )
25. ¿Cuáles de los siguientes conjuntos de vectores son bases paraC3?
a) (1, O, O), (i, i, O), (i, i, i)
c)(i,O,2-i), (O,l,i), ( - i , - 1 - 4 & 3 )
b) (1, O, -i), (1 - t i , 1, 1 - 2i), (O, i, 2)
d)(I,O,i),(2-i,1,2+i),(O,3i,3i)
En los ejercicios del 26 al 29, determinar la dimensión y una base para el espacio solución
del sistema.
26.
x,
( 1 - i)x,
28. x,
ix,
+
+ (1 + i)x, = O
+
2x2 = O
(2 - i)x2
x2
+ 3ix,
+ ( 2 + 2i)x2 +
=o
=O
3ix3 = O
2x1 - (1
27.
(-1 + i ) x ,
29. x,
ix,
+
+
x, = o
+ x, = O
4x3 - 2ix, = O
ix, - 2ix3
+ 3x, +
+ i)x2 = O
10.5 Espacios complejos con producto interior / 637
30. Demostrar: Si u y v son vectores en el espacio n euclidiano complejo, entonces
u.(h)=k(u.v)
31. a) Demostrar el inciso b ) del teorema 10.4.1.
b) Demostrar el inciso c) del teorema 10.4.1.
32. (Para quienes ya estudiaron C&lculo).Demostrar que el complejo C( - m , m ) es un
subespacio del espacio vectorial de funciones con valores complejos de una variable
real.
33. Establecer la identidad
-4111
4
- vil2
+ -1i1 + iv1I2 4i llu
-
-
para vectores enel espacio n euclidiano complejo.
10.5
ESPACIOSCOMPLEJOS CON PRODUCTOINTERIOR
En la sección 6.1 se dejnió el concepto de producto interior sobre un espacio
vectorial rzal usando como axiomas las propiedades básicas del producto interior
euclidiano sobre R". En esta sección se dejnirán productos interiores sobre espacios vectoriales complejos usando como axiomas las propiedades del producto
interior euclidiano sobre C".
ESPACIOS
UNITARIOS
La siguiente definición es originada por el teorema 10.4.1
Definición. Un producto interior sobre un espacio vectorial complejo V es
una función que asocia un número complejo (u, v) a cada par de vectores u y v
en V de modo que los siguientes axiomas se cumplen paralos vectores u, v y
w en V y los escalares k.
-
1) ( u , v ) = ( v , u )
2) ( u + v, w ) = (u, w ) + (v, w )
3) (ku, v) = k( u, v )
4) ( v , v ) r 0 y ( v , v ) = O siysólosi v = O
I
Un espacio vectorial complejo con un producto interior se llama espacio con producto interior complejo o espacio unitario.
Las siguientes propiedades adxionales se deducen de inmediato a partir de
los cuatro axiomas de producto interior:
638 / Espacios vectoriales complejos
(i) ( O , v > = ( v , O > = O
(ii) (u, v + w ) = (u, v ) + (u, w )
(iii) (u. kv) = %(u,v )
Como sólo iii) difiere de los resultados correspondientes para productos interiores reales, se demostrará y las otras demostraciones se dejan como ejercicio.
(u, kv) = (kv, u)
= k(v, U )
k( V , u )
[ h o m a 31
[Propiedad delos conjugados]
k(u, v )
[Axioma I ]
"
=
[Axioma 11
-
Ejemplo 1 Sean u = (u1, u2, . . . , un) y v = (vl, v2,. . . , vn) vectores en P. Por el
teorema 10.4.1, el producto interior euclidiano (u, v) = u
v =
u1ulVl +u2V2+...+unVn satisface todos los axiomas de producto interior. A
Ejemplo 2 Si
son matrices cualesquiera 2 X 2 con elementos complejos, entonces la sigwente
fórmula define un producto interior complejo sobre elcomplejo
(comprobar):
Por ejemplo, si
entonces
10.5 Espacios complejos con producto interior / 639
Ejemplo 3 (Para quienes ya estudiaron Cdlculu). Si Ax) = fl(x) + if2@) es una
función con valores complejos de la variable real x y si fl (x) y f2(x) son continuas
sobre [a, b ] , entonces
JUhf(4
U
ID
+
dx =
[fl(4
b
if2(x)ldx =
h
fl(4
dx + i l ,
f2(4
dx
En palabras, la integral de Ax) es la integral de la parte real de f más i veces la
integral de la parteimaginaria de f:
Se deja como ejercicio demostrar que si las funciones f = f l ( x ) + iJ2(x) y g =
gl(x) + ig2(x) son vectores en el complejo C[a, b ] , entonces la siguiente fórmula
define un producto interior sobre el complejo C[a,b ] :
En espacios con producto interior complejo, así como en espacios con producto interior real, la norma (o longitud) de un vector u se define por
y la distancia entre dos vectores u y v se define por
Se puede demostrar que con estas definiciones los teoremas 6.2.2 y 6.2.3 siguen
siendo verdaderos en espacios con producto interior complejo (ejercicio 35).
Ejemplo 4 Si u = (ul, u2, . . . , un) y v = (vl, v2,. . . , vn) son vectores en C" con el
producto interior euclidmno, entonces
Y
640 1 Espacios vectoriales complejos
Obsérvese que estas expresiones son justamente las fórmulas para la norma y la
distancia euclidianas analizadas en la sección 10.4. A
Ejemplo 5 (Para quienes y a estudiaron Cálculo). Si el complejo C[O, k]
tiene
el producto interior del ejemplo 3 y si f = elm, donde m es cualquier entero,
entonces con auxilio de la fórmula (15) de la sección 10.3 se obtiene
CONJUNTOS
ORTOGONALES
Las definiciones deconceptoscomo vectores ortogonales, conjunto ortogonal,
conjunto ortonormal y base ortonormal se aplican sin cambio a espacios unitarios. Además, el teorema 6.2.4, los teoremas de la sección 6.3 y el teorema 6.5.4
aún son válidos en espacios con producto interior complejo,
y el proceso de
Gram-Schmidt se puede usar para convertir una base cualesquiera de un espacio
con producto interior en una base ortonormal.
Ejemplo 6 Los vectores
u = (i, 1)
y
v = (1, i)
en 62 son ortogonales con respecto al producto interior euclidiano, ya que
u.v=(i)(i)+(1)(5)=(i)(l)+(l)(-i)=o
A
Ejemplo 7 Considérese el espacio vectorial C3 con el producto interior euclidiano.
Aplicar el proceso de Gram-Schmidt para transformar los vectores básicos u1 =
( i , i , i ) ,u2 = (O, i , i), u3 = (O, O, i ) , en una base ortonormal.
Solución.
Paso 1.
v I = u, = (i, i, i)
1O.5 Espacios complejoscon producto interior / 641
Así.
forma una base ortogonal para 6 3 . Las normas de estos vectores son
de modo que una base o r t o n o d para C3 es
Ejemplo 8 (Puru quienes ya estudiaron Cúfcufo).Sea el complejo C[O,2 n ] con
el producto interior del ejemplo 3, y sea W el conjunto de vectores en C[O, 2 n ] de
la forma
elmr = cos mx
+ i sen mx
donde m es un entero. El conjunto W es ortogonal porque si
son vectores dstintos en W, entonces
642
/
Espacios vectoriales complejos
1
-
-sen
[k-1
=
(O)
-
(k - l ) x
k- 1
i(0) = O
Si se normalizacada vector del conjuntoortogonal W. se obtiene un conjunto
ortonormal. Pero en el ejemplo 5 se demostró que cada vector en W tiene norma
f i , dc modo que los vectores
forman un conjunto ortonormal en el complejo C[O, 2 n ] . A
EJERCICIOS DE LA SECCIóN 10.5
1. Sean u = ( u , , u 2 ) y v = (v], v2). Demostrar que (u, v) = 3u, 324
i
1 1
+2u
i
2 2
define un
producto interior sobre p.
2. Calcular (u, v) usando el producto interior del ejercicio l .
a) u = (2;. - i), v = ( - i, 3;)
b) u = ( O , O), v = ( 1 - i, 7 - 5i)
c) u = ( 1 + i, I - i), v = ( 1 - i. 1 + i)
d) u = (3i, - 1 + 2 i ) , v = (32, - 1 + 2i)
3. Sean u = ( u , , u 2 )y v = (v,,v2). Demostrar que
(u, v )
=
u,Ü,
+ ( 1 -t- i)u,Ü2 + ( 1 - i)u,u,- + 3u2Ü2
define un producto interior sobre C 2
4. Calcular (u, v) usando el producto interior del ejercicio 3
a)
U=
C) U =
b) u = (O, O), v = ( 1 - i, 7 - 5i)
d ) u = (3i. - 1 2i), v = ( 3 , - 1 + 2i)
(2i, - I ) , v = ( - i, 3i)
(1 + i, 1 - i), v = (1 - i, 1 + i )
+
5. Sean u
= ( u , , u z ) y v = (vl, v2). Determinar cuáles de las siguientes expresiones son
productos interiores sobre p.Para las que no lo sean, enumerar los axiomas que no se
cumplen.
a) ( u , v ) = u,Ü,
d) (u, v ) = 2u,U,
-
b) (u, v ) = u,ü, - u p 2
+ iu,ü, + iu,ü, + 2u,ü2
+
c ) { u , v ) = (uI/2(ul(2
e) (u, v ) = 2u,ü, + iu,ü2- iu,ü,
+ 2u,ü,
10.5 Espacios complejos conproducto interior / 643
6. IJsando el producto interior del ejemplo 2, encontrar (U, V) si
- "
7. Sean u = ( u I ,u2, u3)y v = (vl,v2, v3).¿(u, v) = yvI+~v2+u3v3-iu3v,define un pro-
ducto interior sobre C3?En caso negativo, enumerar todos los axiomas que no se cumplen.
8. Sea Vel espacio vectorial de las funciones con valores complejos de la variable real x ,
y sean f =&(x) + z&(x) y g = g l ( x ) + ig,(x) vectores en V. ¿La expresión
(f3
g) = (fl(0) + ifAO))(g,(O)+ ig,(O))
define un producto interior sobre P En caso negativo, enumerar todos los axiomas que
no se cumplen.
9. Sea c" con el producto interior del ejercicio 1. Encontrar I(w((si
a) w = ( - i , 3 i )
b) w = ( l - i , l + i )
c) w = ( O , 2 - i )
d) w=(O,O)
10. Para cada vector del ejercicio 9, usando el producto interior euclidiano encontrar I(w((
11. Usando el producto interior del ejercicio 3 , encontrar llwll si
a) w = ( l , -i)
b) w = (-li ,
1 +i)
c) w = ( 3 - 4 i , O )
12. Usando el producto interior del ejemplo 2, encontrar
d) w=(O,O)
l!,4(( si
13. Sea C2 con el producto interior del ejercicio 1. Encontrar d(x, y) si
b) x = ( l - i , 3 +2i), y = ( l + i , 3 )
.a) x = ( l , l ) ,y = ( i , -i)
14. Repetir l a s instrucciones del ejercicio 13 usandoel producto interior euclidianosobre
c.
15. Repetir las instrucciones del ejercicio 13 usando el producto interior del ejercicio 3.
16. Sea el complejo MZ2con el producto interior del ejemplo2. Encontrar d(A, B ) si
17. Sea C3 con el producto interioreuclidiano.¿Para
qué valores complejos de k los
vectores u y v son ortogonales?
a) u = ( 2 i , i , 3 i ) , v = ( i , 6 i , k )
b) u = ( k , k , l + i ) , v = ( l , - 1 , l - i )
644
i
Espacios vectoriales complejos
18. Sea n/r.2 con el producto interior del ejemplo 2. Detenninar cuáles de las siguientes
matrices son ortogonales a
19. Sea C" con el producto interior euclidiano. Demostrar que para todos los valores de 0
20. Sea ('? con el producto interioreuclidiano.¿Cuálesdelossiguientes
ortononnales?
a) (i, O),(O,
1 - i)
b)
('
- -v5'
), (v5"*
) (
v5
"
C
'
21. Sea
con el producto interioreuclidiano.¿Cuáles
ortonornlales?
c)
conjuntos son
), (
"
v5'v5
--r
v2'
de los siguientes conjuntos son
22. Sea
Demostrar que {x, y) es un conjunto ortonomal si C2 tiene el producto interior
(u, v ) = 3u,ü,
+ 2u2ü2
pero no es ortonomal siC* tiene el producto ulterior euclidiano
23.
es un conjunto ortogonal en C4 con el producto interior euclidiano. Normalizando cada
uno de estos vectores, obtenerun conjunto ortonomal.
24. Sea C 2 con el productointerioreuclidiano.Usandoel
transformar la base {u,, u2} en una base ortonomal.
a) u I = (i, - 3 4 , u2 = (2i, 22)
proceso de Gram-Schmidt,
b) u I = (i. O), u2 = (32, - 5 ; )
)
"
v5
(d) (i,O), (0,O)
1O. 5 Espacios complejos con producto interior i 645
c3con el producto interioreuclidiano. Usando el proceso de Gram-Schmidt,
transformar la base { u l , u2, ug}en una base ortonormal.
a) uI = (i, i, j), u2 = ( - i , i, O), uj = (i, 22, i)
b) u1= (i, O, O), u2 = (3i, 7i, - 2 4 ,
25. Sea
26. Sea C4 con el productointerioreuclidiano.
Usando el proceso de Gram-Schmidt,
transformar la base { ul, u2, u3, u4} en una base ortonormal.
u, = ( O , 2i,i, O),
u3 =(i, 2i, O, -i), u,=(i,
u 2 = ( i , -i, O, O),
27. Sea C3 con el productointerioreuclidiano.Encontrarunabase
subespacio generado por (O, i, 1 - i) y (-i, O, 1 + 2).
O, i, i)
ortonormal para el
28. Sea C4 con el producto interior euclidiano. Expresar w = (-i, 22,6i, O ) en la forma w =
w, + w2, donde el vector w, está en el espacio W generado por u1= (-i, O, i, 2;) y u2 =
(O, i, O, i), y w2 es ortogonal a W.
29. a) Demostrar: Si k es un número complejo y (u, v) es un producto interior sobre un es-
pacio vectorial complejo, entonces (u
-
kv,
u
-
k v ) = (u, u)
- i (u, v)
-
k(u,v)+kk(v,v).
b) Usando el resultadodelincisoa),demostrar
que O
I (u, u) -
k (U, V)
-
k(u,v)+kz(v,v).
30. Demostrar que si u y v son vectoresen un espacio con producto interior complejo,entonces
KU.
v)l’
5
(u3U X V , v )
Este resultado,denominado desigualdad de Cauchy-Schwarz para espacios con
producto interior complejo, difiere de su análogo real (teorema 6.2.1) en que es necesario incluir un signo de valor absoluto en el miembro izquierdo. [Sugerencia Sea k =
(u, v)/(v, v) en la desigualdad del ejercicio 29b).]
31. Demostrar: Si u = ( u I ,u2, . . . , un>y v = (v,,v2, . . . , v,,) son vectores en c”,entonces
lUlÜI
+ U’ü2 +
‘ ’ ’
+ U,ünl 5 (jU,/’+ / U 2 / ’ +
’ ‘
.
+ lu,12)1’2(/u,/2
+ IU2l2 +
‘ ’ ‘
+ JU”J2)”2
Esta es la versión compleja de la desigualdad de Cauchy analizada en el ejemplo 1 de
la sección 6.2. [Sugerencia Usar el ejercicio 30.1
32. Demostrar queenla
desigualdad deCauchy-Schwm
paraespacios
vectoriales
complejos la igualdad se cumple si y sólo si u y v son linealmente independientes.
33. Demostrar que si (u, v) es un producto interior sobre un espacio vectorial complejo,
entonces
(O, v ) = (v, O ) = o
u3
= (0,4i. i )
646 / Espacios vectoriales complejos
(u, v
+ w) = (u, v) + (u, w )
35. Los teoremas 6.2.2 y 6.2.3 siguen siendo verdaderos en espacios con producto interior
complejo. En cada inciso, demostrar que así es.
. Teorema 6.2.2d.
a) Teorema 6 . 2 . 2 ~ .b) Teorema 6.2.2b.c) Teorema 6 . 2 . 2 ~d)
b) Teorema 6 . 2 . 3 ~ .f) Teorema 6.2.36. g) Teorema 6 . 2 . 3 ~h). Teorema 6.2.3d.
36. En el ejemplo 7 se demostró que los vectores
forman una base ortonormal para C3.Usando el teorema 6.3.1, expresar u = ( 1
- i, 1 +
i, 1) como una combinación lineal de estos vectores.
37. Demostrar que si u y v son vectores en un espacio con producto interior complejo, entonces
, vn} es una base ortonormal para un espacio V conproducto
38. Demostrar: Si {v v
1’ 2 ” ”
interior complejo y SI u y v son vectores cualesquiera en V, entonces
[Sugerencia.Aplicando el teorema 6.3.1,expresar u y w como combinaciones lineales
de los vectores básicos.]
=A(.) + If,(.)
y g = g , ( x )+
39. (Para quienes ya estudiaron Crflculo).Demostrar que si f
ig2(x)son vectores en el complejo C[a,b ] , entonces la fórmula
define un producto interior complejo sobre C[a,b]
40. (Para quienes ya estudiaron Ccflculo).
a) Sean f =&(x) + if,(.)
y g = g l ( x )+ igz(x) vectores en C[O, 1J , que tiene el producto
interior
Demostrar que los vectores
e2 m’mx
,
m = o,
* 1, +2,
forman unconjunto ortogonal.
b) Obtener un conjunto ortonormal normalizandolos vectores del inciso a).
-
1 O. 6 Matrices unitarias, normales y hermitianas / 647
10.6 MATRICESUNITARIAS,NORMALES Y HERMITIANAS
Para matrices con elementos reales, las matrices ortogonales (Ap1 = A T ) y las
matrices simétricas (A = AT) desempeñaron un papel importante en el problema
de diagonalización ortogonal (sección 7.3). Para matrices con elementos complejos, las matricesortogonales y simétricas son relativamente poco importantes;
son reemplazadas por dos nuevas clases de matrices, la matrices unitarias y hermitianas. que se analizarán en esta sección.
MATRICES
UNITARIAS
Si A es una matriz con elementos complejos, entonces la transpueda conjugada
de A , que se denota por A*, se define como
donde
es la matriz cuyos elementos son los conjugadoscomplejosde
mentos correspondientes en A y
los ele-
ATes la transpuesta de 2 .
Ejemplo 1 Si
entonces
de modo que
Las propiedades básicas de la operación conjugada transpuesta son semejantes a las de la transpuesta:
Teorema 10.6.1. Si A y B son matrices con elementos complejos y k es cualquier número complejo, entonces:
a ) (A*)* = A
b ) ( A +B)* = A * +B*
c) ( M ) * = kA*
d ) (AB)* = B*A*
Las demostraciones se dejan como ejercicios.
Recuérdese que una matriz con elementos reales se denomina ortogonal
si A" =AT.Los análogos complejos de las matrices ortogonales se llaman matrices unitarias, y se definen como sigue:
648 / Espacios vectoriales complejos
~~
A con elementoscomplejos se denomina
Definición. Unamatrizcuadrada
unitaria si
I
El siguiente teorema es similar alteorema 6.5.1.
Teorema 10.6.2. Si A es una matriz n X n con elementos complejos, entonces
las siguientes proposiciones son equivalentes.
a ) A es unitaria.
b ) Los vectores renglón de A forman un conjunto ortonormal en c" con el
producto interior euclidiano.
c ) Los vectores columna de A forman un conjunto ortonormal en c" con el
producto interior euclidiano.
Ejemplo 2 Los vectores renglón de la matriz
r
l+i
l+i
~-
A=
2
2
1-i
-l+i
2
"
son
r1 =
l+i
2
I).
l+i
r2 =
(?. -+)
1-i
-l+'
Con respecto al producto interior euclihano sobre Cn,se tiene
Y
i
i
-""
-0
2
2
1 O. 6 Matrices unitarias, normales y hermitianas / 649
de modo que los vectores renglón forman un conjunto ortonormal en
unitaria y
c.Así. A es
El lector debe comprobar que la matriz (2) es la inversa de la matriz (1) probando
q u e m * = A*A =I. A
DIAGONALIZACIÓN UNITARIA
Recuérdese que una matriz cuadrada A con elementos reales se llama diagonalizable ortogonalmente si hay una matriz ortogonal P tal que P"AP (= P'AP) sea
diagonal. Para matrices complejas se tiene un concepto análogo.
Definición. Una matriz cuadrada A con elementos complejos se denomina diagonalizable unitariamente si existe una matriz unitaria P tal que P"AP (=
P*AP) es diagonal; se dice que la matriz P diagonaliza unitariamente a A .
Hay dos preguntas a considerar:
¿Qué matrices son diagonalizables unitariamente?
¿Cómo determinar una matriz unitaria P a fin de efectuar la diagonalkación?
Antes de responder estas preguntas se observa que las definiciones ya proporcionadas de los conceptos eigenvector, eigenvalor, eigenespacio, ecuación
caracterí3ica y polinomio característico se cumplen sin cambio en espacios vectoriales complejos.
MATRICES
HERMITIANAS
En la sección 7.3 se vio que a
ls matrices desempeñaban un papel fundamental en
el problema de diagonalizar ortogonalmente una matriz con elementos reales. Los
análogos complejos más naturales de las matrices simétricas reales son las matrices hermitianas*, que se definen como sigue:
Definición. Una matriz cuadrada A con elementos complejos se denomina
hermifiana si
A =A*
*Charles Hermite (1822-1901) matemático francés que realizó contribuciones fundamentales al álgebra, a
la teoría de matrices y a varias ramas del análisis. Es conocido por usar integrales para reso1ver:una
ecuación polinómica general de quinto grado. También demostró que el número e (la base de los logaritmos
naturales) no es raíz de ninguna ecuación polinómica con coeficientesracionales.
650
.I
Espacios vectoriales complejos
Ejemplo 3 Si
i
-5
2+i
l+i
z;i]
1
-i
i
l+i
-5
2-i
1-i
2+i
3
A = [ Li
1-i
entonces
I=[
de modo que
lo cual significa que A es hermitiana. A
Es fácil reconocer las matrices hermitianas por inspección: los elementos
de la diagonal principal son números reales (ejercicio 17),y la "imagen especular" de
cada elemento de ladiagonal principal es su conjugado complejo (figura 1).
MATRICES
NORMALES
Las matrices hermitianas poseen muchas propiedades, aunque no
todas, de las
matrices simétricas reales. Por ejemplo, así como a
ls matrices simétricas reales
son diagonalizables ortogonalmente, se verá que las matrices hermitianas son diagonalizables unitariamente. Sin embargo, a pesar de que las matrices simétricas
ls únicas matrices con elementos reales que se pueden diagonalizar
reales son a
ortogonalmente (teorema 7.3.1), las matrices hermitianas no constituyen toda la
clase de matrices diagonalizables unitariamente; es decir, existen matrices &agonalizables unitariamente que no son hermitianas. Para explicar por qué es así se
necesita la siguiente definición:
Definición. Una matriz cuadrada A con elementos complejos se denomina
normal si
AA*
= A*A
1 O. 6 Matrices unitarias, normales y hermitianas / 651
Ejemplo 4 Toda matriz hermitiana A es normal, ya que AA* = AA
matriz unitaria A es normal, ya que AA * = I = A *A. A
= A*A,
y toda
Losdos teoremas siguentes son los análogos complejos de los teoremas
7.3.1 y 7.3.2. Se omiten las demostraciones.
Teorema 10.6.3. Si A es una matrizcuadradacon
elementoscomplejos,
entonces las siguientes proposiciones son equivalentes:
a) A es diagonalizable unitariamente.
6 ) A contiene un conjunto ortonormal de n eigenvectores.
~~
Si A es una matriznormal,entonces
eigenespacios diferentes de A son ortogonales.
10.6.4.
los
eigenvectores de
El teorema 10.6.3 establece que una matriz cuadrada A conelementos
complejos es dagonalizable unitariamente si y sólo si es normal. El teorema
10.6.4 será crucial para obtener una matriz que diagonalice unitariamente una
matriz normal.
PROCEDE
MIENTO DE
DIAGONALIZACIÓN
En la sección 7.3 se vio que una matriz simétrica A es diagonalizada ortogonalmente por cualquier matriz ortogonal cuyosvectores columna sean eigenvectores
de A . De manera semejante, una matriz normal A es diagonalizada por cualquier
matriz unitaria cuyos vectores columna sean eigenvectores de A . El procedimiento
para diagonalizar una matriz normal es como sigue:
Paso 1.
Paso 2.
Paso 3.
Encontrar una base para cada eigenespacio de A.
Aplicar el proceso de Gram-Schmidt a cada una de estas bases a fin
de obtener una base ortonormal para cada eigenespacio.
Formar la matriz P cuyas columnas son los vectores básicos obtenidos en el paso 2. Esta matriz diagonaliza unitariamente aA.
La justificación de ese procedimiento debe ser evidente. El teorema 10.6.4
asegura que eigenvectores de eigenespacios diferentes son ortogonales, y la aplicación del proceso de Gram-Schnudt asegura que los eigenvectores del mismo eigenespacio son ortonormales. Así, todo el conjunto de eigenvectores obtenido con este
procedimiento es ortonormal. El teorema 10.6.3 asegura que este conjunto orton o d de eigenvectores es una base.
Ejemplo 5 La matriz
652 / Espacios vectoriales complejos
es diagonalizable unitariamente porque es hermitiana y, por tanto, es normal. Encontrar una matriz P que diagonalice unitariamente a A .
Solución. El polinomio característico de A es
det(AZ-A)
a-2
= det
-I-i
1-3
-l+i
1
=(a-2)(a-3)-2=a2-5a+4
de modo que laecuación característica es
y los eigenvalores son 1 = 1 y 1 = 4.
Por definición,
es un eigenvector de A correspondiente a 1 si y sólo si x es una solución no trivial
de
[
a-2
-l+i
-'il[;;]=[;]
A-3
Para encontrar eigenvectores correspondientes a 1 = 1, este valor se sustituye
en (3):
[
- I- +
l i
-l-i][;:]=[;]
-2
Resolviendo este sistema por eliminación de Gauss-Jordan se obtiene (comprobar)
x, =(-1
"QS,
x2=s
Así, los eigenvectores de A correspondientes a ;1= 1 son los vectores diferentes de
cero en 62 de la forma
x=
[
( - 1 - i)s]+ll-i]
10.6 Matrices unitarias, normales y hermitianas / 653
Por tanto, este eigenespacio es unidimensional con base
u=
[
-'l-i]
En este caso el proceso de Gram-Schmidt es de un solo paso; la normalización de
este vector. Como
el vector
es una base ortonormal del eigenespacio correspondiente a il = l .
Para encontrar los eigenvectores correspondientes a il = 4, este valor se sustituye
en (3):
[
-l+i
-"i][;;]
1
=
[o]
Resolviendo este sistema por eliminación de Gauss-Jordan se obtiene (comprobar)
x, =
x*
=S
de modo que los eigenvectores de A correspondientes a il = 4 son los vectores
diferentes de cero en C? de laforma
X = [(?)S]
S
=S
Así, el eigenespacio es unidimensional con base
654 1 Espacios vectoriales complejos
Aplicando elproceso de Gram-Schmidt (es decir, normalizando este vector) se
obtiene
Por tanto,
r-
-1-i
diagonaliza a A y
P”AP=
EIGENVALORES
DE MATRICES
HERMITIANAS Y
SIMÉTRICAS
[A y]
l+i
-
A
En el teorema 7.3.2 se estableció que los eigenvalores de una matriz simétrica con
elementos reales son números reales. Este importante resultado es un corolario del
siguiente teorema más general.
~~
Teorema 10.6.5.
reales.
Los eigenvaloresde
una
matriz hermitiana son números
Demostración. Si A es un eigenvalor y v es uneigenvector correspondiente de
una matriz hermitiana A n X n, entonces
Av = Av
Multiplicando por la izquierda cada miembro de esta ecuación por el conjugado
transpuesto de v se obtiene
Se demostrará que ambas matrices v*Av y v*v 1 x 1 tienen elementos reales, de
modo que por (5) se concluirá que debe ser un número real.
Tanto v*Av como v*v son hermitianas, ya que
(v*Av)* = v*A*(v*)* = V*AV
I O.6 Matrices unitarias, normales y hermitianas / 655
Y
(v*v)*
= v*(v*)* = v*v
Como las matrices hermitianas tienen elementos reales sobre la diagonal principal
*
y como v * ~ vy v v son 1 x 1, se concluye que estas matrices tienen elementos
reales, con lo cual se completa la demostración. 0
Teorema 10.6.6. Los eigenvalores deuna
reales son números reales.
matriz simétrica con elementos
Demostración. Sea A una matriz simétrica con elementos reales. Debidoa que
los elementos de A son reales, se concluye que
A=A
Pero esto indica que A es hermitiana, ya que
Así, por el teorema 10.6.5,A tiene eigenvalores reales.
EJERCICIOS DE LA SECCIóN 10.6
1. En cada inciso, encontrar A*.
c) A = [7i O
-3i]
d) A =
'22
'23
2. ¿Cuáles de las matrices siguientes son hermitianas?
3. Encontrar k, I y m de modo que A sea una matrizhennitiana
0
656 / Espacios vectoriales complejos
4. Aplicando el teorema 10.6.2., determinar cuáles de las siguientes matrices son unitarias.
r
i
-1
I
-
"
v5
c) ["i 1 - 1
-
d)
+ i]
I + i
0
v%
-
i
i
__
v5
1
v5
L
5. En cada inciso, comprobar que la matriz es unitaria y encontrar su inversa.
d)
6. Demostrar que la matriz
es unitaria para todo valor real de 8.
En los ejercicios del 7 al 12, encontrar una matriz unitaria P que diagonalice a A y determinar P"AP.
A=[l';
';;I
,.A=[;
-;]
, . A = [ 2 - 62 i
2 +42 i
r
[3(11
3 : ~
11. A =
[
5
O
O
1
i
-
2
i
--
v5v5
0
-1
-l+i
-I-i
O
O
12. A =
v5
1
-
13. Demostrar que los eigenvalores de la matriz simétrica
2
--Z
i
0
- v5
0
2
no son reales. ¿Este hecho viola el teorema 10.6.6?
14. Encontrar una matnz 2 X 2 que sea hennitiana y unitaria y cuyos elementos no sean
todos números reales.
-
i
3
1
-
3 f i
4+3i
v5
Ejercicios complementarios / 657
"
15. Demostrar: Si A es una matriz n X n con elementos complejos, entonces
lb'.
,
'!
=
__
det(A). [Sugerencia Primero demostrarque los productos cl ":
son los conjugados de los productos elementales de A con sign J
'
.
:
: :: ;igno
16. a) Aplicando el resultado del ejercicio 15, demostrar que si A es una matriz n
X
n con
elementos complejos, entonces det(A*) = det(A).
b) Demostrar: Si A es hermitiana, entonces det(A) es real.
c) Demostrar: Si A es unitaria, entonces Idet(A)I = l .
17. Demostrar que los elementos sobre la diagonal principal de una matriz hermitiana son
números reales.
18. Sean
matnces con elementos complejos. Demostrar que
b) (A B)* = A * + B*
c) (kA)* = kA*
a) (A*)* = A
+
d) (AB)* = B*A*
19. Demostrar: Si A es invertible, entonces tambiénA* lo es, en cuyo caso (A*)" = (A")*.
20. Demostrar que si A es una matriz unitaria, entonces también A* es unitaria
21. Demostrar que una matriz n x n con elementos complejos es unitaria si y sólo si sus
renglones forman un conjunto ortonormal en C" con el producto interior euclidiano.
22. Usando los ejercicios 20 y 21, demostrar que una matriz n X n es unitaria si y sólo si
sus columnas forman un conjunto ortonormal en C" con el producto interior euclidiano.
23. Dzmostrar: Si A = A*, entonces para todo vector x en C", el elemento en la matriz
x Ax de 1 X 1 es real.
24. Sean 1 y p eigenvalores distintos de una matriz hermitiana A.
a) Demostrar que si x es un eigenvector correspondiente a 1 y y 'es un eigenvector
*
*
correspondiente a p , entonces x*Ay = 1 x y y x Ay = px*y.
b) Demostrar el teorema 10.6.4. [Sugerencia Restar las ecuaciones en el inciso a).]
EJERCICIOS COMPLEMENTARIOS
1. Sean u = (uI,u2, . . . , u,) y v = (ul, u2, . . . , u,) vectores en C", y sean
u = (üI,i d 2 , . . . , u,) y v = (U1, ü*, . . . , u,).
a) Demostrar: u.V = Ü.V.
b) Demostrar: u y v son ortogonales si y sólo si ii y 7 son ortogonales.
658 / Espacios vectoriales complejos
2. Demostrar que si la matriz
es diferente de cero, entonces es invertible.
3. Encontrar una base para el espacio solución del sistema
4. Demostrar: Si a y b son números complejos tales que
+ lb12 = 1 y si O es un número
real, entonces
es una matriz un~taria
S. Encontrar los eigenvalores de la matriz
donde =
6. a) Demostrar que si z es un número complqo diferente de 1, entonces
Sugerencia Sea S la suma del miembro izquierdo de la ecuación y considérese la
cantidad S - zS.
b) Usando el resultado del inciso a), demostrar que si z" = 1 y z # 1, entonces 1 + z +
=2 + . . . + z"-l = 0
c) Usando el resultado del inciso a), obtener la identidad trigonométrica de Lagrange
1 sen[ (n + +)O]
1 +cosO+cos2o+~~~+cosnO"+
2
2sen(O/2)
para O < O < 277. [Sugerencia Sea z = cos O + i sen O.]
7. Seaw=e2n1'3.Demostrarquelosvectoresvl= ( l / f i ) ( l , 1, 1 ) , v 2 = ( 1 / f i ) ( 1 , w , w
y v3 = ( I / f i ) (1, w2, w 4 ) forman un conjunto ortonormal en
el inciso b) del ejercicio 6.1
2)
~ 3 [Sugerencia
.
usar
Ejercicios con~picmentnrios// 659
8. Demostrar que si U es una matriz unitaria n X n y lz,l= 1z2/= . . . = Iz,I = 1, entonces
el producto
también es unitario.
9. Supóngase que A* = -A.
a) Demostrar que id es hermitiana.
b) Demostrar que A es diagonalizable unitariamente y que tiene eigenvalores imaginarios puros.
10. a) Demostrar que el conjunto de números complejos con las operaciones
(a
+ bi) + (c + di) = (a + c) + ( b + d ) i
y k(a + bi) = ka
donde k es un número real, es un espacio vectorial real
b) ¿Cuál es la dimensión de este espacio?
+ kbi
RESPUESTAS
A LOS
EJERCICIOS
EJERCICIOS DE LA SECCIóN 1.1 (Página 27)
1.
a),
2 . 4, b), c)
c), f )
3. a) x = $
+jt
x2 = S
x I = i r - 0s + i t x2 = r
u = $q - $r + Qs - QI
w=q
xj = t
X)
x=r
y=s
b) x I = {S - 4t
y=t
+f
=S
x, = t
z=t
o
[.
1
c)
0
S.
a) 2 x ,
3x,
2
0 - 1
3
1
0
1
=O
-
7
4x2 = o
x2 = 1
1
o
-1
0
b) 3x,
7x,
1
+
x,
- 2x2
2
i]
O
-
+
+
d)
0
2X) =
4x, =
x3 =
[:y
1
5
3
-3
7
'1
c) 7x1 + 2x2
x1
d)
+
X) -
+ 2x2 + 4x,
XI
x3
- 2y = 5
5
I
=
7
=
x, =
3
4
= -2
x2
6. a) x
=
3x4 =
b) Sea x = r, entonces t -y = 5. Al despejar y se obtieney = it - 5.
8. k = 6: infinidad de soluciones
k # 6: no hay soluciones
Ningún valor de k produce una solución.
9. a) Las rectas no tienen punto de intersección común. b) Las rectas se intersecan exactamente en un punto
c) Las tres rectas coinciden.
661
1.
a) iildeíXd,J
c) 5 x 5
b) 4
P) 5
X
X
2
2
e ) hdefmdad)
g ) Indefinida
Indefinida
h) 5 X 2
~]
5
d)
[
2.
a = 5,
-7
-28
-21
-7
b = - 3, c = 4, d = 1
-141
-35
Respuestas a los ejercicios / 663
e)
[-::] [y -A] [
3
a
e)
g)
f)
[
1:
9
a
45
-11
17
l;]
13
9
-13
O
[
f) 21
17 35]
17
1
2
1
g)
[
I:]
h)
-6
[
-:
9
- 13
1
2
-4
-1
h)
[:n
y]
-6
6
-2:
24
I:]
16
i) 61 (j) 35 (k) 28
7 . a) [67 41
411
b) [63 67
571
c)
F:]
67
d)
[ :]
63
[24
e)
56 971
f)
663 1 Respuestas a los ejercicios
IO. a) [67
[64
[63
b) [6
[6
[63
41 411 = 3[6 -2
21 591 = 6[6 -2
67 571 = 0[6 -2
- 6 701 = 6[3 -2
17
311
=0[3 - 2
= 7[3 - 2
41
1221
--:
13. . ) A = [ !
14. a)
.
-3
r
i],x=[:],b=[-a]
3x, - xz + 2x3 = 2
4x, + 3x, + 7x3 = - 1
-2x,
x,
5xs = 4
+
.
41 - 2 [O 1 31 + 7[7 7 51
41 + 5 [O 1 31 + 4[7 7 51
41 + 4[0 1 31 + 9[7 7 51
71 - 2[6 5 41 +4[0 4 91
71 + 1[6 5 41 + 3[0 4 91
71 + 7[6 5 41 + 5[0 4 91
b)
3w - 2~
4
b)A=l5
0
2
o
-5
3
+
1
3
O
9
1
z =O
5w
+2y-2z=O
3 w +x + 4 y + 7 z = O
--2w+5~+ y+6~=0
+
I S.
16. a)
[--;
-15
-111
-15
b)
o
44
2
355
3
25
23
24
17. a) A , , esunamatrizde2 X 3 y B , , esunamatriz 2 X 2. A , , B , , noexiste
a,,
o
o
O a , , O
21.
o
o
o
o
0
a55
o
o
o
o
a)
‘66
1
-8
-1
1
Respuestas a los ejercicios / 665
o
a,,
o
a21
'22
0
a31
a32
a33
'41
'42
'43
a51
a52
a53
'61
'62
a63
[
'1
a,,
al2
0
'21
a22
'23
u32
a33
o
o
0
'44
o
o
a54
a64
'1 1
1 2
1 3
2 3 4 5
22. a)
b)
4 5 6 7
5 6 7 8
.I
18. OA y A0 no puedentener
4
1
o
[;
1-
0
o
o
o
o
o
o
el mismo tamaño.
-1
-1
I:].
19.
o
o
o
'34
o
0
a a4 a45 4 3
o
o
a54
o
-1
'56
a66
a65
1
4
8
9 2 7
16 64-
20. a) Un ejemplo es
b) Un ejemplo es
o
o
['
O
r1
o
:]
kl
1
666 / Respuestas a los ejerciclos
EJERCICIOS DE LA SECCIóN 1.5 (Página 83)
2. a) Sumar tres veces el primerrenglón al segundo renglón
b) Multiplicar por el tercer renglón.
c) Intercambiar el primer renglón y el cuarto renglón.
d) Sumar veces el tercer renglón al primer renglón.
1. c), 4 , f ,
3
+
3.a)
["
'1 [:1 :]
O
o1 O
1
0
b)
O
1
O
c)
0
[
"1
y
d)
o I
-2
[A y
2
0
1
4. No, porque C no se puede obtener efectuando unasola operación en los renglones de B
5. a)
[ -: -:] [-:
z]
5
2
b)
c) N o e s invertible
[-i 8 81
1
c)
b) No es invertible
2
0
1
-
P
2
0
O
O
o - o o
1
-1
k
O
k2
0
o -I o o
0
0
-
0
0
1
O
0
k'l
kl
k2
0
"
O
0
o
2
-1
L
0
8. a)
-
1
-
I-
-
1
"
o
0
1
-
k3
0
o ,
-
1
k4
-
b)
1
k3
1
- 0
kl
0
0
-
-1
k
“lu
Respuestas a los ejercicios 1 667
16. b) Sumar - 1 veces el primer renglón al segundo renglón.
Sumar - 1 veces el primer renglón al tercer renglón.
Sumar - 1 veces el segundo renglón al primer renglón.
Sumar el segundo renglón al tercer renglón.
EJERCICIOS DE LA SECCIóN 1.6 (Página 92)
17. b , = b2
16. b , = 2b2
11
-6
-15
12
-8
+ b3
73
27
-18
-38
1
-21
9
19. 6 , = b3
18. No hay restricciones
+ b,,
b2 = 26,
22. a)
sólo
la solución
trivial
x 1 = x, = x3 = x4 = O; invertible
b) Intinidad de soluciones;
no
es invertible
-35
EJERCICIOS DE LA SECCIóN 1.7 (Página 100)
1. a)
2. a)
[’ y]
[“ -:I [
0
b)
4
4
10
b) A z = rl
oi,O],
o
o o &
4.
b), c)
5. a)
8. a) No conmuta
[ F]
-1
b)No es invertible c)
-1
-2;
60
I::
I:]
20
-16
A”-r
9”
O O
o o
’
\
:],
3k
O *O]
0
A-.=[:
o o
16
6. u = 11,b= - 9 , c = - 1 3
b) Conmuta
10. a)
[i
4k
7. ~ = 2 , b =- 1
;
O
-
$ 0 - 0
b ) [O i
61
-
O 0 1
7
/’
“__
.
-
+ 6,
+
668 / Respuestas a los ejercicios
11. a)
[:!: 1::
3 0 0
5 O]
1::][0
O
a32
a33
O
c) Es simétrica
20. a) Es simétrica b) No es simétnca
24.
a) x , = $ , x , =
-*
¡,x,=
IY. n
-2( I + n )
b) No
7
b) x , = - + , X , =
d) No es simétrica
-3
-$,X,=
EJERCICIOS COMPLEMENTARIOS DEL CAPíTULO 1 (Página 102)
I. x ' = i x + + y , y ' =
-+x+$
2. x ' = x c o s ~ + y s e n ~ , y ' = - x s e n ~ - ~ . i v c o s ~
4. 3 monedas de 1 centavo, 4 de 5 centavos y 6 de I O centavos
3. Una respuesta posible es
x, - 2x, - x3 - x, = o
x,
5x2
2x, = o
+
+
S. x = 4, y = 2, z = 3
b)a#O,b=2
d)a=O,b#2
7. a) a f O , b # 2
C) a = O , b = 2
-I,c= 1
10. a = 2 , b =
12. a) Z =
6. Infmidad si a = 2 o a =
[y:
ninguna en caso contrario
8. x = $ , y = 9 , 2 = +
11. a) X =
-::]X
--%
6
b) z1 =
z2 =
0
Y.
IC=[:
:]
b) X =
1
-3i
-37
- X , - 7x2+ Ilx,
1 4 ~ , lox2 - 26x3
+
EJERCICIOS DE LA SECCIóN 2.1 (Página 114)
I.
a) 5
b) Y
2. Impar
a)
3. 22
c) 6
d) 10
b) Impar c) Par
S. S2
4. O
d) Par
e) Par
f ) Par
7. a Z - 5 a + 2 1
6. - 3 f i
12. -c4+c3-16c2+8c-2
16. 275
f) 2
e) O
13. a) a = 1 , a = -3
17. a) = - 120
b) = -120
3
18. x="--
b)
a=
t
m
10. - 4
9. -65
8. O
11. -123
-2,~=3,a=4
4
EJERCICIOS DE LA SECCIÓN 2.2 (Pagina 120)
I.
a) -30
7 . 33
b) -2
8. 39
Y. 6
c)
O
d) O
10. -Q
3. a ) - S
b) - 1
I t . -2
12. a) - 6
c) 1
4. 30
b) 72
c) - 6
5. 5
6. -17
d) 18
Respuestas a los ejercicios / 669
EJERCICIOS DE LA SECCIóN 2.3 (Página 129j
1.
a) det(2A)= -40=2'det(A)
b) det(-2A)=-208=(-2),det(A)
2. det A B = - 170 = (det A)(det B ) 4. a) Invertible b) N o es invertible c) No es invertible d) No es invertible
S. a) - 189 b) - f c)
12.
a)k=-
5 2 m
2
-3
d)
b) k = - 1
- & e)
6. Si x = O, los renglones primero y tercero sonproporcionales.
Si x = 2, los renglones primero y segundo son proporcionales
7
14. a)
[""
c) ["3
-2
a-2][::]=[:]
-1
at-3
-I
EJERCICIOS DE LA SECCIóN 2.4 (Página 142)
I["'] 1 3
x,
=
"
Respuestas a los ejercicios
670
EJERCICIOS COMPLEMENTARIOS DEL CAPíTULO 2 (Página 145)
13. a) Deben intercambiar las columnas i-ésima yj-ésima.
h) L a i-ésima columna se debe dividir entre c.
c) I,a~-ksimacolumna se debe sumar "c veces a la i-ésima colu~nna
1%
18.
a) k3 + ( - a l l
A=
a)
-
~ +u
a22- a33)12+ ( a l l a 2 ,+ u11a33 + u22a33 - a 1 2 ~-2 a1 1 3 ~-3 u1 ~
(alla23a32 + 412u21u33 + a13a22u31 - u11a22a33 - a12u23u31
I-:],[y],
-5,1=2,1=4;
[I":]
b)
A=
[-!]
I;
~
~
)
~
- u13'21432)
EJERCICIOS DE LA SECCIóN 3.1 (Página 157)
+
3 . a) PIP2= ( - I ,
-
P
- 1)
b)
e ) s = ( - 5 , 12, -6)
P1P2=(-7,
6. a) ( - 2 , 1, -4)
d) (80, -20, - 80)
8. c , = 2 , c 2 = - l , c , = 2
c)
f) P I P 2 = ( l r-1, -2)
4. a) Q(5, IO, - 8) es una respuesta posible.
b) Q( - 7 , - 4, - 2) es una respuesta posible.
p,p;
= (2, 1)
+
g) P,P, = ( - a ,
-2)
d)
- b , -c)
h)
b) ( - 10, 6 4 )
c) ( - 7 , 1, 10)
e ) (132, -24, - 72)
f) ( - 7 7 , 8, 94)
I O . c, = c, = c 3 = o
1 1 . a)
2
7 . x = (-9,
(3, -i, -f)
'
-9
2. a)
b)
fl
3. a) V%
1. k =
fl
b) 2b)
*x
4
c) 5
d ) 2~
b)x= - l , y = 3
2
c)
f) 6
e) 3V%
d) 3 f l
fi+ac ) 4 f i
d
)
a
e)
(-
3
8. Una esfera de radio 1 con centro en (xo, y,, z 0 )
6
-
--)m
4
t, 9)
12. a) x' = 5,y' = 8
L)
4,4
EJERCICIOS DE LA SECCIóN 3.2 (Página 162)
a) 5
= (a,b, c)
5 . a) P( - 1, 2, - 4) es una respuesta posible.
b) P(7, -2, -6) es una respuesta posible.
b) (23
4 ,
1.
p,p; = (a, b)
f) 1
Respuestas a los ejercicios / 671
EJERCICIOS DE LA SECCIóN 3.3 (Página 173)
11.
4v5
b
6. a)
b)
5
c)
18
-
m
x
43
d)
9. a) 102
m cos e, = 3 m
, 3
',
10
e, = -,10
COS
12. Elángulorecto
=O
COS
b) 1252/5
c) 170
d) 170
está en B.
EJERCICIOS DE LA SECCIóN 3.4 (Página 187)
b) ( - 14, -20, - 82)
e) (-44, 55, -22)
1. a) (32, -6,
-4)
d) (O, 176, -264)
2. a) (18, 36, - 18)
8. a) -10
II.
a) No
13.
(-,
b) Sí
c) No
-),4
m m'a
a
17. a) -
2
b)
a
3
fi
3. a)
9. a) -3
b) -110
-- 3
6
b) (-3, 9, -3)
C) (27, 40, -42)
f) (-8, -3, -8)
b) 3
d) -3
c) 3
c) O
b)
e) - 3
4. a)
b ) m
2
10, a) 16
f) 0
b) 45
12.
(--,-
3
19. a)
-
6
m
1 2 m
16* 49
15* 2 ( v x u )
2
23. a ) m = ( O , l , O ) y n = ( 1 , 0 , 0 )
--
m
m
b)
3
b)(-l,O,O)
21. a)
m
c)(O,O,-I)
b) 0
-
40'19
28.(-8,0,-8)
31. a ) j
b)&
EJERCICIOS DE LA SECCIóN 3.5 (Página 198)
1.
a) -2(x + 1) + (y - 3) - (z + 2) = O
b) (x - 1) 9(y - 1) 8(2 - 4) = O
c) 2z = o
d)x+2y+3z=O
+
+
2. a) - 2 x + y - z - 7 = 0
b)~+9~+&-42=0
c) 2z = o
d)x+2y+3y=O
3. a) (O, O, 5) es un punto en el plano y n = (-3, 7, 2) es un vector normal de modo que -3(x - O) + 70, - O) +
2(z - 5) = O es una forma punto-normal; otros puntos y otras normales producen otras respuestas correctas.
672
1
Respuestas a los ejercicios
4. a) 2y
-
z
+ 1=o
b)
X
+ 9V - 5z - 26 = O
S. a) No son paralelos
b) Son paralelos
c) Son paralelos
h . a) Son paralelos
X.
7. a) No son perpendiculares
b)
Son
perpendiculares
b) No son paralelos
a) Son perpendiculares
b) No son perpendiculares
11. a)
X = -12-7t,y=
-41 - 2 3 t , z = t
b)x=$t,y=O,z=t
10. a ) x = 5 + t , y =- 2 + 2 t , z = 4 - 4 t
b ) ~ = 2 t , ~- t~, Z== -3t
12.
9. a) x = 3 + 2 t , y =- I + t , z = 2 + 3 t
b)x= -2+6t,y=3-6t,z= -3-2t
c) x = 2 , v = 2 + t , z = 6
d)x=t,y= -2t,z=3t
+
a) (-2, 4, 1) .(x I , y - 2, z - 4) = O
b)(-l,4,3).(X-2,;,~+5)=0
c) (-1,O,O).(.x-5,y+2,z])=O
d) (a, h, C) * (x, Y , Z) = 0
13. a) Son paralelos
b) No son paralelos
15. a) (x,y, z) = ( - 1, 2, 3) + t(7, - 1, 5) ( - m < t < +m)
b ) ( x , y , z ) = ( 2 , 0 , - l ) + t ( l , 1, 1) ( - m < t <
+m)
c) (x,y,z)=(2,-4,l)+t(O,O,-2)
(--co<t< +m)
14. a) Son perpendiculares
b) No son perpendiculares
d ) (.x,~v,
Z ) = (O, O, O)
17. 2 ~ + 3 y - 5 ~ + 3 6 = 0
b) x-x,=O
19. a) z - z o = O
22.
18. a)
(-y,
-9,y)
z=O
b) y = O
c) y - y , = O
23.y+22-9=0
27. x + ~ v + ~ z1 8- = 0
+ t ( ~b,,
(-m
C)
<t <
c) x = O
20. 7 ~ + 4 y - 2 ~ = 0 21. 5 ~ - 2 ~ + ~ - 3 4 = 0
24. x - y - 4 ~ - 2 = 0
28. ( ~ - 2 ) + ( y + I ) - 3 ( ~ - 4 ) = O
26. x = % t - 2 , y -=% t + 5 , z = t
29. 4 ~ + 1 3 ~ - ~ - 1 7 = 0
30. 3 ~ + 1 0 ~ + 4 ~ - 5 3 = 031. 3 ~ - ~ - ~ - 2 = 032. 5 ~ - 3 , ~ + 2 ~ - 5 = 0
3.3. 2 ~ + 4 v + 8 ~ + 1 3 = 0 36. ~ - 4 ~ + 4 ~ + 9 = 307 .
3)
b)
39. a)
42. a)
$
b)
x-3
-q1g
c)
4
z + y3 - x3 + 22 - 2
I =3
-y+
-2
40.
a)
b) -6
1
2
m
b) O
C)
x=g+&t,.Y=-#-$t,Z=f
X = -$t, y = O, z = t
2
-
6
-
-
2
6
43.
a) X - & 1 7 = 0 y x + 4 z - 2 7 = 0 esunarespuestaposible
b) x - 2y = O y - 7.v + 2z = O es una respuesta posible.
44.
a) 0
-
35"
b) 0
-
79"
45. 0
-
75"
EJERCICIOS DE LA SECCIóN 4.1 (Página 215)
I.
2.
a) ( - 1 , 9, - 11, 1)
d) (-90,
-114,60,
-36)
(g,d,$,g)
h. a)
m
3.
b)
(-13, 13, -36, -2)
f ) (27, 29, -27, 9)
b) (22, 53, - 19, 14)
e ) (-9,-5,-5,-3)
~,=1,c,=I,c,=-I,c,=1
m +V%
c) 4V'%
+m)
d)
C)
5. a)
m
e)
b)3
1
c) 13
2
d ) f i
di 3 v 5 3V5'3di
Respuestas a los ejercicios 1 673
8. k =
r$
11.
a)
14.
a) Si
9. a) 7
c) 7
b) 14
b) 2-
c)
b) No
c ) Sí
fi
d) 11
10. a)
d) 10
d) No
15. a) k = -3
f) Sí
e ) No
19. x , = ~ , x , =
-l,x3=2
16. S $ ( - 3 4 , 4 4- 6, , l l )
b) k = -2, k = -3
20. -6
33. a) Medida euclidiana de la "caja" en R": a , a2 . . . a ,
+ a: +
b) Longltud de la diagonal: \'a?
' ' '
+ ai
EJERCICIOS DE LA SECCIóN 4.2 (Página 235)
1.
2. a)
3.
4.
b) No lineal; R2 -+ R3
d) No lineal; R4 + R2
a) Lineal; R3 + R2
c ) Lineal; R3 -+R'
['
3
[i -1
a)
S. a)
[-P
- 1
b)
['
O]
o
8. a) (-1,-2)
13. a)
(
(
c)
[-: I:]
d)
[I
0
d)
1
y
:]
1
1
1
[" :]
O
O
-8
[I
O
1
3
-- O]
1
b,
[
7
2
1
o
-1
b)
c)
"1
-
o
[
d)
O
1
O
+
+ 4x,
3x, + 5x2 + 7x3]
-2x,
6x1
x2
-
d)
x3
[
-x,
+
2x,
7x,
+ 4x2]
O
O
1
O
-1
x2
+ 8x2
(b) T(2,1, -3)=(0, -2,O)
(b) (1,2)
3fi2 +4,3
~
1 2 1
5 O]
O
a) (2,O) (b) (O, - 5 )
12. a)
[:-1 111
c) [l
1
[ :] [
-
b)
I : ] ; T ( - 1 , 2 , 4 ) = ( 3-, 2-, 3 )
7. a) T ( - 1 , 4 ) = ( 5 , 4 )
IO.
'1
1
[: -:]
1
6. a)
o0
"35
1 0 0 0
-y
c ) (2, - 1 )
11. a) (-2, 1,O)
___
+tfi)
-2, ",",
___
9. a)
(2,
-5, -3)
c) (O, 1, 3)
b) ( - 2 , 0 , 3 )
?v5
3 - 4 v- 3 f i - 4
b) (O, 1 , 2 v 5 )
b) (2, 5, 3)
c ) (-1,
-2,2)
-v5
c) (-2, - 5 , 3)
674
Respuestasa los ejercicios
15. a)
(
-2,-
v 5 + 2 -1+2v5
2
'
2
b) ( - 2 l h , I , O)
c ) (1,
2. 2)
EJERCICIOS DE LA SECCIóN 4.3 (Página 252)
1. a) No es uno a uno
e) Esuno
auno
b) Es uno a uno c) Es uno a uno
f) Esunoauno g) Esunoauno
3. Por eJemplo, el vector (1, 3) no está en el dominio.
J.
Por ejemplo, el vector ( I , 6,2) no está en el dominio
d) Es uno a uno
Respuestas a los ejercicios / 675
S. a) Es uno a uno;
-!I
[!
3
[
o
-1
[I
1
-2
c) Es uno a uno, -
6 . a) Es uno auno,
; T-
5
,(MI,,w2)= (+x, - $x,
o ] ; T P L ( w , w,)
,
+xl
+ $x2)
-xl)
= ( -X,,
b) No es uno a uno
d) No es uno a uno
4
I:]; T"(w,,
w2,w3) = (x, - 2x,
+ 4x3, - X I + 2x2 - 3x3,
-X1
3% - 5x3)
d) No es uno a uno
b) Rotaciónporelánguio - n/4.
d) Reflexión con respecto al plano yz
7. a) Reflexión con respecto al eje x.
e) Contracción por un factor de f
e) Dilatación por un factor de 5.
.
8. a) Lineal
b) No lineal
c) Lineal
d) Lineal
9. a) Lineal
b) No lineal
e) Lineal
d) No lineal
10. a) Lineal
b) No lineal
12.
11. a) Lineal
a) Para una reflexión con respecto al ejey. T(e,)=
[
b) No lineal
[J
b) Para una reflexión con respecto al plano xz. T(e,)= O
r1
I
Por tanto, T = O
Lo
y T(e,) =
T(e2)=
I.
0
11
[-!)
[-:P]
y ve3)=1].
[A] [:l.
y í-(e,)=
d) Para una proyección ortogonalsobre el plano z. T(e,)=
e) Para una rotación en un ángulo positivo 0, T(el) =
cost)
-sen%
sen%
COS e
[
Portanto, T =
0 01
-1 O
C) Para unaproyecciónortogonal sobre el eje x. T(e,)=
Por tanto, T =
[y].
1.
I
Portanto, T =
[b :].
676 i Respuestas a los ejercicios
L:i 111
f ) Para una dilatación por un factor k 2 1, T ( e , )= O , T(e,) = k
b) T(e,) =
[a], [!I, [!l.
y T(e,)
T(e,) =
16. a) Transformaciónlineal de R 2 + R 3
[:I
Ix.
a)
a=
1;
ti).
a)
L=
1;
a=
- 1;
b)
a= 1;
[!] [!]
[i]
y
[:I
c)
a=
b)L= I;
L = o;
=
1
Portanto, T = [O
[i]
d)
[i] [!I
y
0
0
O
O]
=
[I
O
. Por tanto, T =
L: : :I
O
O 0 0
b)Transformaciónlineal
1;
, T(e,)
de R3 + R 2
L = 3; todos los vectores en R2 son eigenvectores
k
O
Respuestas a los ejercicios
EJERCICIOS DE LA SECCIóN 5.1 (Página 263)
1. No es un espacio vectorial. No se cumple el axioma 8.
2. No es un espacio vectorial. No se cumple el axioma 10.
3. No es un espacio vectorial. No se cumplen los axiomas 9 y 10.
4. El conjunto es un espacio vectorial bajo las operaciones dadas.
5. El conjunto es un espacio vectorial bajo las operaciones dadas.
6 . No es un espacio vectorial. No se cumplen los axiomas 5 y 6.
7. El conjunto es un espacio vectorial bajo las operaciones dadas.
8. No es un espacio vectorial. No se cumplen los axiomas 7 y 8.
9. No es un espacio vectorial. No se cumplen los axiomas 1, 4, 5 y 6.
10. El conjunto es un espacio vectorial bajo las operaciones dadas.
11. El conjunto es un espacio vectorial bajo las operaciones dadas.
12. El conjunto es un espacio vectorial bajo las operaciones dadas.
13. El conjunto es un espacio vectorial bajo las operaciones dadas.
EJERCICIOS DE LA SECCIóN 5.2 (Página 274)
1. a), c)
2 b)
3. a), b), d)
3
6. a) Recta, x = - L t , y = - -t,
z=t
2
2
b) Recta; x = 21, y = t, z = O
C) El origen
d) El origen
e) Recta; x = -3t,y = -2t, z = t
f) Plano; x -3y + z = O
7 . a), b), d)
4. b), 4 , e)
5. b)
a),
/’
677
Respuestas a los ejercicios
678
X.
a) ( - 9 , -7, - 1 5 ) = - 2 u + v - 2 w
b)(6, 1 1 , 6 ) = 4 ~ - 5 ~ + ~
c) (O, o, O) = ou + ov ow
c)
d ) (7, 8, 9) = Ou - 2u + 3w
9.
+
a) - 9 - 7x - 15x2 = -2p, + p2 - 2p3
b) 6 + 1 I X + 6x2 4p, - 5p2 + pi
o = op, + op, + op,
d) 7 + 8~ + 9x2 = Op, - 2pZ + 3p3
b) Los vectores no generan.
d) Los vectores generan.
11. a) Los vectores generan.
c) Los vectores nogeneran.
12. a), c), e)
13. No
EJERCICIOS DE LA SECCIóN 5.3 (Página 285)
1. a) u2es un múltiplo escalar de u , .
c) p2 es un múltiplo escalar de p l .
3. Ninguno
2. d)
4. d)
S. a) No están en un plano.
b) Están en un plano.
7 . b)
17:Si
V , = $v, -
b) Por el teorema 5.1.3, los vectores son linealmente independientes
d) B es un múltiplo escalar de A .
6. a) No están en la misma recta.
b) No están en la misma recta.
c) Están en la misma recta.
+,, v2 = f ~ +, $v3, v,
=
-&, + gV2
8.
a = -1 a = 1
27
y sólo si el vector es diferente de cero.
18. a) Son linealmente independientes porque vl, v2 y v3 no están en el mismo plano cuando se colocan con
puntos iniciales en el origen.
b) No son linealmente independientes porque v,, v2 y v3 están en el mismo plano cuando se colocan con
puntos iniciales en el origen.
EJERCICIOS DE LA SECCIóN 5.4 (Página 303)
1. a) Una base para R2 tiene dos vectores linealmente independientes.
b) Una base para R3 tiene tres vectores linealmente independientes.
c) Una base para P2 tiene tres vectores linealmente independientes.
d) Una base para MZ2tiene cuatro vectores linealmente independientes
2. a), b)
3. a),
b)
7 . a) ( w ) =
~ (3,
-
7)
8. a) ( v ) ~
= ( 3 , -2, 1)
10. (A),= ( - 1, 1, - 1, 3 )
12. Base: ( -&
4. c), d)
6. b) Dos vectores cualquiera v l , v2, v,
c) (w), = ( a ,
b) ( v ) =
~ ( - 2 , O, 1)
9. a) (pis = (4,
11. Base: (1, O, 1); dimensión= 1
-$, I , O), (O, - I , O, 1); dimensión = 2
-3,
1)
b) (PIS = (0,2, - 1)
SUS
SUS
Respuestas a los ejercicios / 679
13. Base: (4, 1, O, O), (-3, O, 1, O), (1, O, O, 1); dimensión= 3
14. Base: (3, I , O), ( - 1, O, 1); dimensión= 2
16.
Base: (4, -5, l);dimensión= 1
17.
15. No es base, dimensión = O
a)
(g,
c) (2,
1, 0),(-5,0, 1)
- 1, 4)
18.
a) tndimensional 'b) bidimensional
c)
unidimensional
20.
4
{ v l , v2, e l ) o { v l , v2, e 2 )
b) (1, l , O ) , ( O , O , 1)
d) (1, 1, O), (O, 1, 1)
19. tndimensional
b) {vl, v2, e l l 0 { v I 1v2, e21 0 { v I ,v2, e31
21. { v l , v2, eZre 3 ) o { v l , v2, e2, e41 0. { v , , v2, e3, e4)
26. a) Una respuesta posible es { - 1 + x - 2x2, 3 + 3x + 6x2, 9)
b) Una respuesta posible es { 1 x, x2, - 2 + 2x2}.
c ) Una respuesta posible es { 1 x - 3x2}.
+
+
27. a) (O, f i )
b) (1, O)
c) ( - 1, f i )
d)
( a - b,
fib)
EJERCICIOS DE LA SECCIÓN 5.5 (Pagina 319)
1. r l = ( 2 , - 1 , O , l ) , r 2 = ( 3 , 5 , 7 , - 1 ) , r 3 = ( 1 , 4 , 2 , 7 ) ; c l =
3. a)
[;:]=[:I-[-:]
[:I
3 ,c2=
b) b no es el espacio columna de A
[-I
[I1 [-!I
5 ,c3= 7 ,e4=
680
/
Respuestas a los ejercicios
O
1
b) rl = [l
-3
c) rl = [ I
2
d) rl = [l 2
O
4
1 O
O], r,=[O
1
51, r z = [O
-3
O], cI =
[;]M [-;]
O], r3 = [O
[-;Ilc4=[-,1
- 1 51, r2 = [O
1 4
31, r3 = [O
O
1
-31, r,
=
[O
O
O
I],
O 1 -7],r4=
[O
O
O
I],
Respuestas a los ejercicios / 681
EJERCICIOS DE LA SECCIóN 5.6 (Página 333)
1. Rango ( A )= Rango (AT)= 2
2. a) Nulidad = 1, rango = 2; n = 3.
c) Nulidad = 2, rango = 2; n = 4.
e) Nulidad = 2, rango = 3; n = 5 .
3. a) 2; 1
b) 1; 2
4. a) 3; 3; O; O
c) 2; 2
b) 2; 2; 1; 1
f, O; o; 4; 4
e) 2; 2; 3; 7
b) Nulidad = 2, rango = 1; n = 3.
d) Nulidad = 3, rango = 2; n = 5.
d) 2; 3
e) 3; 2
c) 1; 1 ; 2 ; 2
g) 2; o; 4
5. a) Rango = 4, nulidad = O
b) Rango = 3, nulidad = 2
6. Rango = &(m, n), nulidad = n - mín(mj n )
7. a) Sí, O
b) No
c) si, 2
d) Sí, 7
d) Nulidad = 7, número de parámetros = 7
e) Nulidad = 7, número de parámetros = 7
f , Nulidad = 4, número de parámetros = 4
g) Nulidad = O, número de parámetros = O
sí, 4
si, 0
9. b , = r, b, = S, b,
c) Rango = 3, nulidad = 0
8. a) Nulidad = O, número de parámetros = O
b) Nulidad = 1, número de parámetros = 1
c) Nulidad = 2, número de parámetros = 2
e) No
f,
8)
d) 2; 2; 7; 3
= 4s
- 3r, b, = 2r - S, b, = 8s - 7r
12. a) Rango ( A ) = 1 si t = 1; rango ( A ) = 2 si t = -2; rango ( A ) = 3 si t = 1, -2
b) Rango ( A ) = 2 si t = 1,312; rango ( A ) = 3 si f f 1,312
682 / Respuestas a los ejercicios
13. El rango es 2 si r = 2 y s = 1
EJERCICIOS COMPLEMENTARIOS DEL CAPíTULO 5 (Página 335)
1. a) Todo R3
b) Plano: 2~ - 3 y + z = O
c) Recta: x = 2t, y = t, z = O
d) El origen: (O, O, O)
2. Una
recta
que
pasa
por
e1 origen: S = -2
Un plano que pasa por el origen: S = 1
Sólo el origen: S f 1, -2
Todo R3;ningún valor de S
3. a) 4 4 , 1, l)+b(O,-1,2)b)
( u + c ) ( ~ ,- 1 , 2 ) + b ( 1 , 4 , 1)
C) a ( 2 , 3 , 0 ) + b ( - l , 0 , 4 ) + ~ ( 4 , -1, 1)
S. a) v = ( - 1 + Y)V,+ (3 - r)vz + rv3; cualquier r
7. No
6. A debe ser invertible
9. a) Rango = 2, nulidad = 1
b) Rango = 3, nulidad = 2
c) Rango = n + 1, nulidad = n
8. a) Rango = 2, nulidad = 1
b) Rango = 2, nulidad = 2
c ) Rango = 2, nulidad = n - 2
1 1 . (l,x2,x3,x4,x5,x
, .6. . , X")
12. a ) 2
b) 1
c)2
13.0,1,0
d)3
2
EJERCICIOS DE LA SECCIóN 6.1 (Página 350)
a) 2
b) 11
c ) -13
3. a) 3
b) 56
4. a)
I.
d) - 8
-
29
e) O
b) - 15
2. a) -2
5 . b) 29
b) 62
6.
c) -74
d) 8
e) O
b) - 42
7. a)
9. a)
10. a)
13. a)
17. a)
x2
y2
18. a) "+"=I
4
16
19. (u, v ) = c , v ,
+ u2vz
22. No se cumple el axioma 4.
27.
a)
-E
b) O
28. a) O
b) 1
Respuestas a los ejercicios / 683
EJERCICIOS DELA SECCIóN 6.2 (Página 363)
1. a) Sí
b) No
1
3. a) --
v5
c ) Sí
3
m
b) --
c) O
f) Sí
e ) No
d) No
4. a) O
16. a)
[
b)
[E], [a]
12.y= -$x
c)
[I:],
-
3
1o
vi
b) k = -2, k =
13. a) x = t , y = - 2 t , z =
[!
1.
33. (u, v ) = tu,v,
19
6. a) - b) 0
b) O
7. a) Ortogonales b) Ortogonales 8. a) k =
c) Ortogonales d) No son ortogonales
Y. -t#7(-34,44, -6, 1 1 )
2. No
-1
-1
1
O
O
+ Qu,v,
EJERCICIOS DE LA SECCIóN 6.3 (Página 380)
1. a), b), d)
2. b)
3 . b), d)
4.
b), d)
S. a)
6.
-
3
-3t
b) 2 x - 5 y + 4 z =
O
684
/'
Respuestas a los ejercicios
r l
r 1
11
24. a)
L
1
-
v5
v5
1
-
d)
v5
O
f) Las columnas no son linealmente independientes
1
29. v I = -,v2
a
v5
=-
=
+ x + 4x2 = g V 5 vi + &%
V5
2 - 7x2 = --
30. a) 1
b)
3
V , - g q g " ,
v2
+
v3
c) 4 + 3 x = 4 v 5 v , + v z v 2
31. v, = 1, vz = d ( 2 x - l), v3 = d 5 ( 6 x 2 - 6x + 1)
EJERCICIOS DE LA SECCIóN 6.4 (Página 393)
S 1
Respuestas a los ejercicios / 685
2. a) O; los vectores columna no son linealmente independientes.
b) O; los vectores columna no son linealmente independientes.
4. a)
(%,E,#)b) (-5,
5. a) (7,2, 9, 5)
-4, -9)
6. (O, - 1, 1, 1)
7. a)
[::] [:y ]
8. a)
b)
b)
(-y, -j,V,F)
[A : "1 [:y :]
b)
O 0 1
O 0 1
9. a) v I = (1, O, - 5), v2 = (O, 1, 3)
b)
[
10
55
3%] [
[-;$ -i]
43 "3%
44x0
c)
"
36
35
4
IO.
a) v I =(2, -1,4)
b)
21
+ %Yo
- &o
4E
15
+ %YO + b o ]
- 35x0 + &Yo + %o
%O
2
-3i
"
21
8
-
-
&x0
C) [-&X,
21
15. P=AT(AAT)"A
EJERCICIOS DE LA SECCIóN 6.5 (Página 408)
- &Yo
+ #izo
+&Yo-&zo]
&x0 - &Yo
+ &o
686 i Respuestas a los ejercicios
18. a)
19.
( t f i ,3v5,5)
a) (-&$u5,2,
20. a) ( - l , b & $ v 5 )
cos 0 O
21.
a) A = [
O
1
sen0 O
23. u'
+ b2 =
$a,3)
$--$a)
(b) ( l - & b , 6 ,
-$-ifi)
(b) (1, -ia,:fi)
b) ( --$v5,
-sení3
1
O
cos O
-
O
,)A=[:
26. a) Rotación
O
cos0 se:0]
-sení3 cosí3
b) Rotación
27. a) Rotación seguida de una reflexión b) Rotación
u
22.
2
5
12
O
"
4
4
2
"
v5
-f i a
Respuestas a los ejercicios / 687
12. b) Las diagonales de un paralelogramo son perpendiculares si y sólo si los lados del paralelogramo tienen la
misma longitud.
2
1
c = -;
16. a = O, b = --,
no son ímicos
G V 5
EJERCICIOS DE LA SECCIóN 7.1 (Página 423)
I.
c)
b)a2-8a+ 16=0
e) L2 = O
a) A 2 - 2 A - 3 = o
d)A2+3=0
2. a) L = 3 , L = - 1
d) No hay eigenvaloresreales
C) a
b)a=4
e) 1= O
3. a) Baseparaeleigenespaciocorrespondiente
a2-
f)
= m , a = -VE
=1
a A = 3:
[;]
;
base para el eigenespacio correspondiente a A = - 1:
b) Base para el eigenespacio correspondiente a
4. a) a3- 6L2 + 1 1 1 - 6 = o
c) v + g a 2 + + + 8 = 0
e) a3- 6a2 12L - 8 = o
+
a = 1:
-v5
[+(I5 +15fi)
;I=fi:base
a A = O:
b)a3-2a=o
d)a3-a2-a -2=0
f) A3 - 2L2 - m + 36 = o
5. a) a = 1 , a = 2 , ; 1 = 3
b) a = o , n = f l , a =
d ) a = 2 e) a = 2 f) a = - 4 , a = 3
i
[-"I
a:
e) Base paraeleigenespaciocorrespondiente
f) Base para el eigenespacio correspondiente a
[:I
[+I;
a:
base para el eigenespacio correspondiente a 1= -
b) A = O : base
[PI
[t ]
a = 4:
c) Base para el eigenespacio correspondiente a L =
d) No hay eigenespacios.
12=0
f) a 2 - 2 a + 1 = o
+(-1 + 2 f i )
1
C)
a = -8
;I-=
a:base
[+(I5 -:fi)]
$(-1 - 2 ~ 5 )
6118 i Respuestas a los ejercicios
[It]
d ) .=?:base[
f ) A = -4: base [-!];A=':
base[-;j
c) il= - 8: base
7 . a)
x.
9.
a)
(a - 1)2(n+ 2)(il+
a=I,a= -2,a=
a) A. = I : base
13. a ) y = x
c)
[i]
y y=2x
I) =
o
b)
)]
e) L=2:base
[I!]
(a - 4)2(i12+ 3) = o
b) i l = 4
-1
y [:];A=
-;];A=
-l:base[
c) y = O
14. a ) - 5
-2;base[
b) Nohayrectas
-:]
3'
b) A'="[.
O
b) 7
a, = 3:
EJERCICIOS DE LA SECCIóN 7.2 (Página 435)
1. 1 , 2 o 3
2. a) 1 = 3,A = 5
b) Parda = 3, el rango de 31 - A es 1 y la nulidad es 2. Para1 = 5, el rango de 51 - A es 2 y la nulidad es 2.
c) .4 es diagonalizable, ya que los eigenespacios producen un total de tres vectores básicos.
3. No es diagonizable
4. No es diagonizable
5. No es diagonizable
6. No es diagonizable
7. No es diagonizable
Respuestas a los ejercicios / 689
10. p = [
O
1 01
-1
o
0l ] ; P - ' A P = [ OO 1
0 O]
0
1
O 0 2
[A y :]
21. A" = PD"P"
b)
30 o]
0
O 0 2
14. No es diagonizable
1y :] [A 1:
c)
o
O 0 1
O 0 1
3
A];P-'A.-[.
1 0 0
13. F =
12. No es diagonizable
20. a)
y
ll.P=["i
:] [E
d)
-1
o
"1
-1
=
EJERCICIOS DE LA SECCIóN 7.3 (Página 441)
1. a)
b)
c)
d)
e)
f)
A2 - 5A = O; A= O: unidimensional; A = 5: unidimensional
A3 - 2 7 A - 54 = O; A = 6 : unidimensional ; A = - 3 : bidimensional
A3 - 3A2 = O; A = 3 : unidimensional ; A = O: bidimensional
A3 - 12A2+ 3 6 A - 3 2 = O; A = 2: bidimensional,;A = 8: unidimensional
A4 - SA3 = O; A = O: tridimensional; A = 8: unidimensional
A4 - SA3 + 22A2 - 24A+ 9 = O; A = 1: bidimensional;
A = 3 : bidimensional
; P"AP=
[:i]
5. P = [
-a y :];
P"AP=
s o 2
['H
O
-3
O
:]
-50
Respuestas a los ejercicios
690
I
o
-
o
\%
o
0
1
0
v5
1
25
EJERCICIOS COMPLEMENTARIOS DEL CAPíTULO 7 (Página 442)
1. b) La transformación rota u11 h g u l o 0 los vectores; por consiguiente, si O < 0 < x , entonces ningún vector
diferente de cero es transformado en un vector en la misma dirección o en dirección opuesta.
l
750 375
A4
=
[ SO],
125
=
i
0
3 . c) [O 2 1 1
0 0 3
2. L=kconmultiplicidad 3.
[
1875
625
A 3 = [ 2 575
Y. A * = [ ' :
3750
o],:,
EJERCICIOS DE LA SECCIóN 8.1 (Página 458)
-3
-15
150
50].
-8
10
IO
-24
15
Respuestas a los ejercicios / 691
+ 9x2 + 24x3, 14x1
15. T(x~,X,,
X-,)
= (-41x1
16. T(2vl
3v,
+ 4 ~ 3 =) ( -
17. a)
b)
c)
d)
-
+d
6)
0
0
R2; espacio imagen: R2; (T-, T2 0 T,)(x, y) = (3x - 2y, X)
R2; espacio imagen: la recta y = $x; ( T3 0 T, Tl)(x, y) = (4y, 6y)
0
b) Dominio:
U
- 7,
3x2 - 8x3); T(7, 13, 7) = (-2, 3)
R2;espacio imagen: R2; (T20 Tl)(x, y) = (2x - 3y, 2x + 3y)
R2; espacio imagen: la recta y = gx; (T2 Tl)(x, y) = (4x - 12y, 3x - 9y)
R2; espacio imagen: R2; (T2 í“,)(x, y) = (2x + 3y, x - 2y)
R2;espacio imagen: the line x = O; (T, 0 Tl)(x, y) = (O, 2x)
Dominio:
Dominio:
Dominio:
Dominio:
18. a) Dominio:
19. a)
10,
-
0
b) (T, 0 T,)(A) no existe porque T,(A) no es una matriz 2 X 2.
20. (Tl O T,)@(X)) = PW; (T2 TI )@(x)) = P(X)
O
22. (T, 0 T,)(u,
21. T,(v) = ;V
26.
b) (3T)(xI,
27. b) (TI
28.
X*)
= (6x1
U,X
- 3x2,3x2
+ TZ)(X,y) = (3.~3 4x1;
b) No lineal
+
29. a) 4
(T2
+ a2x2)= (uo-tc 1+ uz)x + (ul + 2u2)x2+ u2x3
+ 3x1)
- T~)(x,Y) = (Y, 2x1
b) 3415
c) 1
EJERCICIOS DE LA SECCIóN 8.2 (Página 466)
l . a), c)
3. a), b), c)
2. a)
4. a)
5. b)
c) No existe base.
10. a)
11. a)
[i],[p] [-91
b)
[i] [:],[!I
‘b)
c) Rango ( T ) = 2; nulidad ( r ) = 1
c) Rango(T)=l;nulidad(T)=2
692 / Respuestas a los ejercicios
15. ker(T) = { O } ; R(7') = V
14. a) Rango: Plano xz,espacio nulo; ejey
b) Rango: Plano yz; espacio nulo; eje x
c) Rango: Plano y = x , espacio nulo; la recta x = - t , x = t, z = O
16. a) Nulidad (7') = 2
c) Nulidad (I?= 3
17. Nulidad (I") = O; Rango (7')
b) Nulidad ( T )= 4
d) Nulidad ( r ) = 1
=6
18. a) Dimensión = Nulidad ( r ) = 3
b) No. Para que A x = b sea consistente para todo b en R5, se debe tener R(7') = R5. Pero R(r) f R5, ya que
rango (7') = dim R(73 = 4
25. ker(D) consta de todos los polinomios constantes.
26. ker(J) consta de todos los polinomios de la forma h.
27. ker(D o D)consta de todas las funciones de la forma ax + b.
EJERCICIOS DE LA SECCIóN 8.3 (Página 475)
I.
a) ker(T)=(O};7esunoauno.
b) ker(T)={X[-:]];
c)ker(T)=
d) ker(T)= { O } ; T e s u n o a u n o
d) T"
{ O } ; Tesunoauno.
[I.] [-::::::y:: ]
=
:I}
-
{
5.
a) ker(T) = k [
6.
a) ker(T) = { O }
-
7 . a) T e s u n o a u n o .
8.
a) T es uno a uno.
1 0 . a)
4x, - 5x,
Tnoesunoauno
4. a) No es uno a uno b) No es uno a uno c ) Uno a uno
+ 2x,
b) T no es uno a uno porque ker(T) # { O }
b) T es uno a uno por el teorema 8.3.2.
b) T n o e s u n o a u n o .
t) T es unoauno.
c) Tnoesunoauno.
d)
Tnoesunoauno.
9. No. A no es invertible.
Tno es uno a uno.
b) T"(x,, x2,xj, . . . , x,,) = (x,,, x,c) T - y x , , x 2 , x 3 , . . . ,x,) = (X", X I , X,? , . , >x,- I )
I,
x , - 2 . . . . , xl)
Respuestas a los ejercicios / 693
15. a) (1,
- 1)
d) T"(2, 3) = 2
17. a) Tno es uno a uno.
c ) Tesunoauno. T-'
+X
b) T es uno a uno. T"
[::I=[; ;.I
20. J no es uno a uno porque J(x) = J(x3).
EJERCICIOS DE LA SECCIóN 8.4 (Página 490)
694
/
Respuestas a los ejercicios
+ SX',
b, T:~I)
= 16
+ 5 1 +~19x2, T(v,)
c) T(a, + u,x
+ u2x2)= 2 3 9 ~ 1~246 1 +~ 2~ 8 9 +~ ~
d) T( 1
+ x')
= -6
-
5x
-
11 :]
= 22
12. a) [T,oT,],,,,=
+
T(v,) = 7 + 4 0 ~ 15x2
+
2 -0 1
ill^,
~ ~ 247~2 61~0
+ 56x + 14x2
2
1 1 1
4 , [ T 2 I B . =[oO o2 4 , [ Tl BI ' , B = [ i
S]
-
3
X+
8
b,
~
T
1
+~1 0~7 ~
X2
12
Z
a
T
~
~
B
~
,
B
EJERCICIOS DE LA SECCIóN 8.5 (Página 505)
1
4.
0
0
-;
1
0
0
-~],[*lB,=
1
4
[-; -;
-%I
s. [TI,=
[ ] [ ]
o
0
1 o ,[TI,,=
0 0
o
1 1
O 0 0
~
~
T
~
~
Respuestas a los ejercicios / 695
1
1
1
O 2 4
6
8
O 0 0
8 3 2
donde B es labase normal
b) T es uno a uno
de P4;rango(T) = 5 y nulidad
O 0 0
O 1 6
( r ) =O.
1
c) u; =
13. a) il=
14. a)
[í‘IB
10. a)
8. a) det(T) = 17
b) det(T) = O
c)det(T) = 1
1
=
, u; =
[ij, [!I, [-PI
u; =
-
4, a = 3
a= I, a=
-2,
u;
=
b) Rase para el eigenespacio correspondiente a a = - 4: - 2 + $x + x,;
base para el eigenespacio correspondiente a J. = 3 : 5 - 2x + x’
a=
-1
b) Base para el eigenespacio correspondiente a
base para el eigenespacio correspondiente a
a = 1:
a = - 2:
base para el eigenespacio correspondiente a 1 =
18. b)
-
1:
[-: 3 ;
[-::I
(3 + y ,G4+
5)
-
~
EJERCICIOS COMPLEMENTARIOS DEL CAPíTULO 8 (Página 508)
1. NO. T(x, + x’) = A(x, + x2) + B # (AX,
T(cx) = cAx B f c(Ax + B ) = cT(x).
+
2. b) A”
=
i
cosn0 -senno
senno
cosn0
+ B ) + (Ax, + B ) = í‘(x,) + í‘(x,),
1
5. a) T(e,) y dos cualquiera de í‘(e,), T(e,), y
T(e,) constituye una base para el rango; ( - 1,1,
es una base parael kernel.
b) Rango = 3 nulidad = 1
6 . a)
(-4,
--Y,
11,
y si c # 1, entonces
b) (1,0, 0) y (-2, 1, O)
7. a) Rango ( r ) = 2 y nulidad ( T ) = 2
b) T no es uno a uno.
O, 1)
696
Respuestas a los ejercicios
/'
1 0 0 0
1 1 . Rango = 3, nulidad = 1
13.
14. a) v, = 2u, + u,, v, = - u 1 + u, + u3,v, = 3u, + 4u, + 2u,
b) uI = -2v, - 2v, v3, u, = 5v, + 4v, - 2v3, u3 = -7v, - 5v,
+
A oy
-4
15. [ T I E = [
19.
[l!]
..
..
+3
d) - 3 2
1
o
e)
-1
-2
-1
~
o 1 o o ."
o o 1 o ."
o o o 1 ."
..
A]
-1
17. [Z']B=[!
c) e'
b) x
20. a)
-y]
+ 3v3
o o o
1 o o
o 4 o
0O
O
O
25.
..
o o o o '.'
o o o o
" '
..
.
1
O-
-o
" '
o
o
" '
O
" '
O
$ '..
.. ..
. .
O
o o ..'
1
n+l
EJERCICIOS DE LA SECCIóN 9.1 (Página 520)
1.
a) y , = cle5"- 2c,e-"
y, = c , $ x + c,e-"
b) y , = O
y, = O
3. a) y , = --,eZ' + c3e3x
y2 = clex+ 2c,e2" - c3e3"
y, = 2c,eZ"- c3e3"
5. y
+ c2e-Z'
= cle3*
2. a) y , = cle7"- 3c,e-"
y, = 2c,e7"+ 2c,e-"
b) y , = eZ'- 2c3"
y, = ex - 2e2" 2e3"
y 3 = - 2e2" 2e3+
+
+
6. y = c,eX+ c2e2' + c3e3"
EJERCICIOS DE LA SECCIóN 9.2 (Página 531)
b) y I - - 4L~ e
y, =
+
7x+se-x
- me
27 - X
4. y , = (c, + c2)e2" cje&
y, = - c2eh c3eSx
y, = - cleZ' c3e"
+
+
Respuestas a los ejercicios / 697
6. a)
b)
c)
d)
e)
r)
Rectángulo con vértices en (O, O), (1, O), (1, -2), (O, -2).
Rectángulo con vértices en (O, O), (- 1, O), (- 1,2), (O, 2).
).
Rectángulocon vértices en (O, O), (1, O), (1, ), (O,
Cuadrado con vértices en (O, O), (2, O), (2,2), (O, 2).
Paralelogramo con vértices en (O, O), (1, O), (7,2), (6,2).
Paralelogramo con vértices en (O, O), (1, -2), (1, O), (O, 2)
7. Rectángulo con vértices en (O, O), (-3, O), (O, 1). (-3, 1)
1 1
11. a) Expansión por un factor 3 en la dirección x.
b) Expansión por un factor
c) Deslizamiento cortante por un factor 4 en la direcciónx.
'1
o
12* a) [O
o
'][O
- 5 en la dirección y.
; expansión en la dirección y por un factor de 3, luego expansión en la dirección x porun
factor d e 2
; oblongamiento en la dirección x por un factor de 4, luego oblongamientoen la dirección
; expansión en la dirección y por un factor de -2, luego expansión en la
dirección x por un factor de 4, luego reflexión con respecto a y = x
d)
:][A :]
[1 y] [
-
; oblongamiento en la dirección x por un factor de -3, luego expansión en la
direccióny por un factor de 18, luego oblongamientoen la direccióny por un
factor de 4
17. a ) y = f x
16. 1 6 y1-1 x - 3 = 0
18.
-I
[:-:]
.
. ..
~
b) y = x
c)y=ix
1
19. b) No. A no es invertible.
. .. .
22. a)
d) y = -2x
0
0
698 1 Respuestas a los ejercicios
1 k O
d)
a=
1:
[A]
e)
a=
1:[~]
f ) ( O entero imparmúltiplo de
T)
A=
--
1:
( O entero par múltiplo de x) A. = 1:
( O no múltiplo entero de
T)
no hay eigenvalores
EJERCICIOS DE LA SECCIóN 9.3 (Página 542)
1. y = + + $ x
2. ~ = $ + Q x
4. y = - 5 + 3 x - 4 x 2 + 2 x 3
3. y = 2 + 5 x - 3 x 2
8. y = 4 - .2x +- .2x2;si x = 12, entonces y = 30.4 ($30.4 miles
EJERCICIOS DE LA SECCIóN 9.4 (Página 550)
1. a) ( 1 + ~ ) - 2 s e n x - s e n 2 x
2. a)
4 ~ +’ 4 cos x + cos 2x +
b) $7r2+4
4.
4T
1
1
3. a) --+-eX
2 e-1
coskx
k2
a) (4e- 10)+(18
-6e)x
3
cos 3x - 4 x senx - 23r sen 2x - -sen 3x
3
x--
k=l
+-
b) ( 1 + m ) - 2
b)
(3 - e)(7e - 19)
2
b)
1
12
3-e
2e-2
6
b) 1 - -
3
5. a) -x
T
T 2
EJERCICIOS DE LA SECCIóN 9.5 (Página 558)
9
3. a) A = [ - :
4. a)2x2
-B
3
+ 5y2 - 6xy
-4
b)
b) 7x:
[-:
1
+ 5x,x,
-5
5
o +
9
c ) A = [ $1
c) x 2 - 3y2 + 5z‘
z
O1
:]
s O
8.
“ 2
-sen(kx)
k
k= I
Respuestas a lcs ejercicios / 699
d)
- 2x:
+ 3x: + 7x1x2+ x1x3+ 12x2x3
5. a) valor máximo = 5 at -t (1, O); valor mínimo =
11
b) valor máximo =
valor mínimo =
-
+m
1 en -t (O, 1)
-1
2
11
-m
-1
2
valor mínimo =
d) valor máximo =
7-m
2
~
(
en*
3+m )
1
% 5 i z z ' -
I
7
(-,v3v%v%
-, -)
(-,v%v%v3
-, -)
1
6. a) valor máximo = 4en -t
b) valor máximo = 3 en
1
2
1
-
c) valor máximo = 4 en?
7. b)
+ 2x1x3+ 2x,x4 + 2x,x3 + 2x2x4+ 2x3x4
e) 2x1x,
o,-
9. a)
11. a) Positiva def-mida.
d) Negativa
semidefinida.
*
2
1
; valor mínimo =
; valor mínimo = 0 en
A)
1
;valor mínimo = 2en-t
b) Negativa definida.
e) Indeffida.
12. a) Indefinida.
b) Indefinida.
e) Positiva y negativa semidefinida.
-
c) Positiva semidefinida.
f , Indefinida.
c) Positiva definida.
f , Positiva definida.
d) Indefinida.
13. c) No. T(kx) # kT(x), a menos de que k = 1.
14. a) k > 4
b) k > 2
c)
-1
___
1
n(n
16. a) A =
-
-1
n(n - 1)
-1
n
-1
-1
n(n
-
-&m<k<Qm
1)
-I
...
~
1) n(n - 1)
-1
~
n(n
-
1)
n(n
-
1)
. . . ___
n(n
-
1)
b) Positiva s e m i d e f ~ d a
700 / Respuestas a los ejercicios
EJERCICIOS DE LA SECCIóN 9.6 (Página 572)
3. a) 2x2 - 3xy+ 4y2
b) x z - x y
c) 5xy
d) 4x2 - 2y'
e ) y2
Respuestas a los ejercicios 1 701
f) Parábola
7.
a) 9x” + 4 ~= ‘36,~ elipse
c) yf2= 8x’, parábola
e) 18y” - 12x” = 419, hipérbola
b) x” - 16y” = 16, hipérbola
d) x” +y” = 16, circunferencia
f) y’ = -+x’2, parábola
8. a) fipérbola, ecuaciones posibles son
b)
3x’2 - 2y’2 8 = o, - 2x’2 3y’2 8 = o
+
+
12. 6x”’
+ 1ly”’
elipse
= 66,
+
2 V w 2 9x’ - 7y’ = o, 2V5y12 7x’
2 v 5 y Q - 7x’ - 9y’ = o, 2v5Xf2 - 9x’
+
4-p
- y’2
= 3,
A’ , ,
-
=3
IO. 13~”’- 4 ~ = “81,~ hipérbola
11. 2x”’ - 3y”’ = 24, hipérbola
= O, hipérbola
14. m x ” - 3y’ = O, parábola
13. 4y“’
elipse
- x”’
15. a) Dos rectas que se cortan, y = x y y = --x.
b) No existe gráfica.
d) La gráfica es la recta y = x.
c) La gráfica es el simple puntoO).(O,
e ) La gráfica consta de dos rectas paralelas
3
2
x + -y = 2 2.
,m m
f-)
La gráfica es el punto (1,2)
EJERCICIOS DE LA SECCIóN 9.7 (Página 578)
+
2y2 - z2
dc)) Xx2y++yx2z -+zy2z
e) 3z2+ 3x2
1. a) x2
2. a)
[:
o -4
3. a) [x y z ]
+ 4xy - 5yz
-!] [
[:
b) 3x2 + 7z2 + 2xy - 3x2 + 4yz
f-) 2z2
b)
-
+ 2xz + y2
O ’ L
-2
c)
[i
P
d)
i
2
2
o -4
+ 9y’ = o
+ 7y’ = o
d) Hipérbola; ecuaciones posibles son
+ 3y‘2 = 9, 3x‘2 + 7y’2 = 9
9. 2xn2+y”’ = 6,
Parábola; ecuaciones posibles son
+
c) Elipse; ecuaciones posibles son
7x’2
e) Circunferencia
j ) Circunferencia
d) fipérbola
i) Parábola
c) Bpérbola
h) Parábola
b) Elipse
g) Parábola
6. a) Elipse
-;]r]+[7
-1
2
O 21 [:]--3=o
0
[i y :]
o
-1
4. a) Elipsoide.
b) Hiperboloide de un manto.
c ) Kperboloide de dos mantos.
d) Cono elíptico.
e) Paraboloide elíptico.
f) Paraboloide hiperbólico
g) Esfera.
5. a) 9x" + 3 6 ~+' 4zt2
~ =elipsoide.
36,
~ - 2zI2 = 18, luperboloide de un manto.
b) 6 ~+'3yt2
3x12 - 3y0 - z72 = 3, luperboloide de dos mantos.
d) 4x'* + 9y'2 - z'* = O, cono elíptico.
+ 16y" - 162' = O, paraboloide elíptico.
f , 7xt2- 3yI2+ z' = O, paraboloide hiperbólico.
g) x'2 + y'2 + 2'2 = 25, esfera.
e) x"
6. a) 252' - 3yf2- 5 0 ~-' ~150 = O, hiperboloide de dos mantos
b j 2 2 + 2y'' + 82'' - 5 = O, elipsoide.
C) 9 ~+ 4y''
' ~ - 362' = O, paraboloide elíptico.
d) ,Y'? - y'2+ z' = O, paraboloide hlperbólico.
EJERCICIOS DE LA SECCIóN 9.8 (Página 587)
1. Multiplicaciones: mpn; adiciones: mp(n - 1).
2. Multiplicaciones: ( k - l)n3; adiciones: (k
-
l)(n3 - n2).
3.
n=5
Resolver Ax
Jordan
Resolver Ax
=
=
b por eliminación de Gauss
65
50
I +:
reduciendo [A I I] a [IIA"]
Encontrar A"
=b
como x =A" b
+: 100
X:
Encontrar det(A) por reducción de renglones
150
I
X:
=
b aplicando la regla de Cramer
+:
X:
X:
430
375
X:
383,250
343,300
X:
t :
810
+:
980,100
+:
+~:
x:
990,000
i :
x : 1,010,000
x:
900
1100
+:
X:
t:
285
+:
+:
+:
x : 1,000,000
x:
Resolver Ax
383,250
343,300
+:
+:
n = 1000
n = 100
n=lO
b por eliminación de Gauss-
X:
Resolver Ax
I
328,350
333,399
+: 33,163,350
X:
33,673,399
+:
x:
333,832,500
334,333,000
333,832,500
334,333,000
998,001,000
1,000,000,000
999,000,000
1,001,000,000
332,833,500
333,333,999
f : 33,316,633 X IO4
X:
33,366,733 X IO4
Respuestas a los ejercicios
4.
n=10
I
n=100
I
I
/
n=1000
Tiempo de
ejecución
I
Resolver A x
Jordan
=
Resolver Ax
b por eliminación de Gauss
=
b por
eliminación
de Gauss-
Encontrar A-’ reduciendo [A 1 I] a [IIA”]
Resolver A x
=
b como x
=
A” b
I
x
1.55
X
2.84
X
3.50
X
10-4
1.05 X 1 0 - ~
1 0 - ~ 2.41
Encontrar det(A) por reducciónde renglones
1.03 X 1 0 - ~
Resolver Ax
6.18 x 1O-4
=b
aplicando la regla de Cramer
X
90.3 x
EJERCICIOS DE LA SECCIÓN 9.9 (Pagina 597)
1. x ] = 2, x2 = 1
3.
XI
= 3, x2 = - 1
9.
X]
= - 3, x2 = 1, x3 = 2,
1
18. A = P L U =
0
o o
[o
x4
3
o
0
2
XI
= -2,
4.
XI
= 4, x2 = - 1
x2
x3
= -3
10. x, = 2, x2 = - 1, x3 = o, x4 = 0
=1
Ji3
0
1
= 1,
2.
0
1 - 3
o o
o J
0
!J
I
,878
836
2.49
2499
83.9
I
834
X
IO3
703
704 / Respuestas a los ejercicios
EJERCICIOS DE LA SECCIóN 10.1 (Página 607)
31
2.
a) (2,3)
4.
a) 5 + 3 i
5.
a) 2
+ 3i
c ) (-3,
b) (-4,O)
-2)
b) - 3 - 7 ic ) 4 - 8 i
b)
-
1
-
2i
d ) (O, -5)
d) - 4 - 5 i
3. a) x = - 2 , y =- 3
e) 19+14i
b) x = 2 , y = 1
f ) - =2 - E 2. 1
c) - 2 + 9 i
31
t
t
c)
7 . a)
,
I
k
2z = 2
+ 21
++3i
z = 1 + 1
t
8. a) k , = -5, k2 = 3
b) k , = 3, k , = 1
10.
a)9-8i
13. - 2 6 +
18i
9.
b) - 6 3 + 1 6 i
14.
-
+
a) zlz,= 3 3i, 2: = -9, z i = -2i
b) zlzz= 2 6 , ~ := -20
48i, z: = - 5 - 12i
c ) z,z2 = y - i, z: = 8 - 3 + 44, z: = - 6 - 21
1 - lli
c ) -32-24i
IS.
-g+i
+
d)22+19i
16. ( 2 + ~)
11. 76-88i
+ i(1 - f i )
12. 26-18i
17. O
18. -24i
Respuestas a los ejercicios / ,705
19. a)
[
1 +36 i 12i
7i]
- 3 + b, [ 33--25ii
13+13i
-8+12i
-33-22i
O
7 + 9i - 6 + 61
-16-
I
2 + 1Oi
6 - Si
-1i_
22 - l i
-5-4i
9- i
2+5i1
3+3i
1 3 + 3 i 6 +c)
5 i ] 9 - 5l
+
3+8i
1
[
b)
16i
6 + 2i
-1+6i
1'
+ 1"-j5i
-11
-9-
1 v 5
b) z = - k - - - i
2
2
22. a) z = - 1 k i
f 9 + i 12+2i
.
i
;18-2i
13+
:
'
c)
[
1
1
23. b) i
EJERCICIOS DE LA SECCIóN 10.2 (Página 614)
1. a) 2 - 7 i
d) i
4.
a)
b) -3 + 5 i
e) - 9
--%-gi
b)
f)o
g+gi
5. a) - i
b) & + A i
8.
9
c)
c) 7i
2. a) 1
d ) f i
g-#i
625
14.
$2
6251
-8
15.
,
X
b)
b) 7
e)8
c) 5
0 0
d) -u+u'
25
25[
e)
6. a) f + f i
b) - f + + i
'r)
. -1-24'
10. - # + & i
13. - & + h i
17. a)
c) -5i
a) - 1 -2i
1;i
11.
b)
O
c) g+yi
C)
s
d) f + + i
7.
i+ij
1+v3.
4
25l
25
,
X
1-v3
-+-4
a
6 - j
Y.
12. - & - A i
1
,
X
d)
,
X
y = -2
706 / Respuestas a los ejercicios
34.
x,
= -(I - i)t,x,=
35. a)
- i t , x ,= t
[ -: f] [-y ii]
b)
1+ i
-7+6i
1 +2i
I
-i
5-i
-i
1+4i
1
EJERCICIOS DE LA SECCIóN 10.3 (Página 627)
I.
b) ~ / 2 c) - 7r/2
a) O
);(
3. a) 2[cos
+ isen(:)]
d) ~ / 4 e ) 2 ~ / 3 f ) - rr/4
COS P + i m;]
b)
+hen(:)]
c) 5./I[cos(;)
d) 12[cos(T)+isen($)]
e ) 3G[cos(-?)+isen(-?)]
4. a) 6 [ c o s ( S )
c) ‘[cos(
2
5. 1
7.
-6)
6. a) -64
\‘2
a)
_ _+
-
f) .[cos(-:)
+isen(%)]
Ll
v2
+isen(
b) - i
Ty
2. a ) 5n/3
b) :[cos(;)
-E)]
+isen(-:)]
+isen(;)]
d) :[cos(%)
+isen($)]
1+v%
c) - 6 4 f i - 6 4 i
d)
-- 2048
b) - ~ / 3 c) 5 ~ / 3
Respuestas a los ejercicios / 707
8.
11. a) 2 2 ,+ 2 i
b) +(2+2i),+(2-2i)
+
+
+
+
12. Las raíces son+ (2Il4 2'14i), (2,14 - 2,14i) y la factorización es
z4 8 = (2' - 2'142 z3l2).(z2 2'142 23/2).
+
+
13. z gira 90' en el sentido de las manecillasdelreloj
14. a) 16
b)
3i
b) Re(z) = -3, Im(z) = O
c) Re(z) = O, Im(z) = - fi d) Re@)= - 3, Im(z) = O
15. a) Re(z) = -3, Im(z) = O
EJERCICIOS DE LA SECCl6N 10.4 (Página 6 3 4 )
1. a) (34 -i,-2
- i, 4)
c) (-1-2i,2i,2-i, -1)
e) ( - 3 + 2 i , 3 , - 3 - 3 4 i )
c2 = 0 , c 3 = 2 - i
3. cl = - 2 - i ,
6. a)
fl
5. a)
b) fi+V%
8. Todo Iklal que
f
2. (2
b ) ( 3 + 2 i ,- 1 - 2 i ,- 3 + 5 i ,
-i)
d)(-3+9i,3-3i, -3-6i,12+3i)
f) (-1-5i,3i,4, -5)
~
c) f i + f i i
9. a) 3
b) 2 6
d)
b) 2-27i
c)
m
c) -5
fi
+ i, O,
-3
+ i, -4i)
d)
e) (!-$,O)
f) 1
- 1Oi
10. El conjunto es un espacio vectorial bajolas operaciones dadas.
11. No es un espacio vectorial. No se cumple el axioma 6; es decir, el conjunto no es cerrado bajo la multiplicación
escalar. (Por ejemplo, multiplicar por i).
12. NO,R" no es cerrado bajo la multiplicacibn escalar.(Multiplicar un vector diferente de cero de R" por i.)
13. a)
14. b)
15. a), d)
16. a), b), d)
17. a ) ( 3 - 2 i ) u + ( 3 - i ) v + ( l + 2 i )bw) ( 2 + i ) u + ( - l + i ) v + ( - l - i ) w
c) ou + ov ow
d)(-5 - 4i)u (5 2i)v
+ +
+
18. a) Sí
b) No
20. a) u2= iu,
c) Yes
d) No
+ (2 + 4i)w
19. a), b), c)
b) Tres vectores en un espacio bidimensional c) A es un múltiplo escalar de B.
708 i Respuestas a los ejercicios
22. f - 3g - 3 h = O
21. b), c)
26. ( - 1 - i, 1); dimensión = 1
25. a), b), c), d)
28. ( 3 t 6i,
-
23. a) Tres vectores en un espacio bidkensional
b) Dos vectores en un espacio tridimensional
3i, 1); dimensión = 1
24. a), b)
27. (1, 1 - i);dimensión = 1
29. (jz,-+, 1, O), (-$, 2i, O, 1); dimensión = 2
EJERCICIOS DE LA SECCIóN 10.5 (Página 642)
2. a)
b) O
- 12
c) 2i
+ 5i
4. a) - 4
d) 37
b) O
c) 4 - 4 i
d) 42
S. a) No se cumple el axloma 4.
b) No se cumple el.axioma 4. c) No se cumplen los axiomas 2 y 3
d) No se cumplen los axiomas 1 y 4. e) Este es un producto interior.
6.
-
9 - 5i
9. a)
11. a)
7. No se cumplen los axiomas 1 y 4
fl
b)
VÍ6 c) VÍ6
b) 2 V 5
~
14. a) 2
d) O
15. a) 2 G
b) 2 v 3
18. a), b), c)
c) 5
d) O
20. b)
2 1. b),
10. a)
VÍ6 b) 2
b)
12. a) 3 V Í 6
16. a) 7 v 3
b) 2 v 3
[
-2i
l f i 3-i
2. b), d), e )
O
b)
[
d) O
13. a)
m
b) 2 f l
b) 2%6
17. a) -8i
C)
EJERCICIOS DE LA SECCIóN 10.6 (Página 655)
1. a)
%6
c)
4
T’:i
5 +3 71 i
-1-i
i
3. k = 3 + 5 i , Z = i , m = 2 - 4 i
I-:] [TI2
“
-i
(111
c)
1
4. a), b)
d)
‘13
a21
%]
‘23
b) Paraninguno
Respuestas a los ejercicios / 709
b) A"=
5.
L
3-i
-
2
m
4 - 3i
-
7. P =
2v-E
5i
2
m
"
8. P =
; P"AP=
[o4
0
2]
"
v5v5
r
1
i
71;
O
O
O
1
v3
-1
P"AP = O
O
-0
O
5
:I
-2
710
13.
14.
Respuestas a los ejercicios
a = 2 +- i
[ -:d]
n ; no, porque A contiene elementos complejos.
es una posibilidad.
EJERCICIOS COMPLEMENTARIOS DEL CAPíTULO10 (Página 657)
3.
r]
1,
ol
es una posibilidad.
1
5.
A = 1, w, o?
(= O )
10. b) Dimensión = 2
ÍNDICE
Adición de vectores, 150,205, 257-258
627
Adjunta, 135-136
+ngulo de rotación, 228
e g u l o entre vectores, 114,536
Angulos directores, 174
Anticonmutativa, 609
Aplicaciones, 5 13-579
a formas cuadráticas, 5 5 1-578
a ecuaciones diferenciales, 5 13-519
a problemas de aproximación,
543-549
a series de Fourier,546-549
Aproximación pormínimos cuadrados,
384-393, 535-543, 545-546
+bol de permutaciones, 108-109
Area de un paralelogramo, 180
Argz, 618
Argumento, 6 18
principal, 6 18
Argumento principal,6 18
Argumento principal, 618
Axioma de aditividad, 552,339
Axioma de homogeniedad,339
Axioma de simetría, 239,638
Axiomas:
para espacios conproducto interior,
339,63 1
para un espacio vectorial, 259-260
Base, 290,291
cambio de, 398-400
coordenadas relativasa una, 290,
399
normal, 246,291,292,294
Base e s t á n d a r :
parahfin, 295
para o", 628
para Pn, 294
p a r a p , 292
p a r a p , 292
Base normalde Pn,294
Base ortogonal, 368
Base ortonormal, 367-377
C(-
, + ),268,630
C[a,b], 268,630
Cambio de base,399-401
Cauchy, Augustin Louis,208
cero:
matriz, 64
subespacio, 266
transformación, 448
vector, 150,205
Cerrado bajo la adición, 266
Cerrado bajo la multiplicación escalar,
266
Circunferencia unitaria, 343
C . 132
628
base normal de,628
Cociente de números complejos,
6 11614
Codominio, 2 18
d:
Coeficientes, 50
Coeficientes de Fourier, 548
Columna:
de una matriz, 47
espacio, 307
vector, 306
Combinación lineal, 50,270,627
Complemento ortogonal,359,360
Componente:
a lo largo de un vector, 169-173
ortogonal a una subespacio, 372-373
ortogonal a un vector, 169-170
deunvector, 152,155,185
Compresión, 523-524
Condición inicial, 5 14
Cónica imaginaria, 573
Cónica no degenerada,564
Conjugada transpuesta, 547
Conjugado, 77
propiedades del, 614-615,626
Conjunto ortogonal, 367
conjunto ortonormal (devectores), 367,
Cono elíptico, 575
Contracción (operador), 230, 448
Coordenada (S):
de un punto, 154
de un vector, 399
ejes de, 154-155
independiente de las, 685
matriz de, 399
planos de, 154
Cosenos directores, 174
711
712 / hdice
Cramer, Gabriel, 140
De Moivre, Abraham, 622
Desarrollo por cofactores, 131-135
Descomposiciónde un vector, 169
Descomposición LU, 589-598
DescomposiciónQR, 377-380
teorema de, 378
Descomposición triangular, véase
descomposiciónLU
Desigualdad de Cauchy 355,366,645
Desigualdad de Cauchy-Schwa, 208,
354,645
Det, 112
Desigualdad de Schwarz, véase
desigualdad de Cauchy-Schwa
Desigualdad del triángulo, 209
Desviación, 544
Determinante (función):
de un operador lineal, 499
de una matriz 2 X 2,111-1 12
deunamatriz3 ~ 3 111-112
,
definición, 111
derivada de, 146-147
desarrollo por cofactores de, 132
Diagonal principal, 49
Diagonalizable, 426
ortogonalmente, 58
unitariamente, 649
Diagonalización ortogonal, 437
Diferencia de vectores, 37
Dilatación, 230, 406
Dimensión, 292,298
Dirac, Paul Adrien Maurice, 609
Distancia:
en un espacio vectorial complejo con
producto interior, 639
entre puntos, véase Distancia entre
vectores
entre planos paralelos, 196-199
entre rectas paralelas, 196-199
entre un punto y una recta 173
entre un punto y un plano, 196-199
entre vectores, 206-207,
341-342
Distancia euclidiana, 207,80
División de números complejos, 61 1613
Dominio, 2 18
Ecuación característica, 127,416,649
Ecuación cuadráiicas:
e n ~ y y551-552
,
enx,yyz,574
Ecuación diferencial, 513-519
condición inicial para una, 5 14
problema con valor inicial, 5 14
solución general, 5 14
solución particular, 5 14
Ecuación lineal, 2 1
solución de una, 22
Ecuaciones de dependencia, 3 19
Ecuaciones de traslación, 157
Ecuaciones normales, 387
Ecuaciones paramétricas, 193-194
Ecuaciones simétricas, 202
Eigenespacio, 419-420, 502-503
de un operador lineal, 502-503
Eigenvalor, 127 248,413, 502
de un operador lineal, 502-503
Eigenvalores complejos, 418419,601
Eigenvector, 127,248,413,502
de un operador lineal, 502-503
Eje de rotación, 228
Eje imaginario, 603
Eje regal, 603
Elementos, 47
Eliminación de Gauss-Jordan, 33-34,
579,
580,586
Eliminación gaussiana, 2942,142,579,
580,586
Elipse, 564
Elipsoide, 575
Equivalente por renglones, 80, 81
Error cuadrático medio, 545
Error por redondeo, 41
Escalar, 47,149
Esfera unitaria, 343
Espacio euclidiano n dimensional, 633
Espacio generado, 272
Espacio lineal generado, 272-273
Espacio n euclidiano, 203-2 15
complejo, 633
Espacio vectorial complejo con producto
inhior, 632,637
Espacio nulo (kernel), 307
Espacio renglón, 307
Espacio unitario, 637
Espacio(s) vectorial(es):
axiomas de, 257-258
base de, 290-295
complejos, 258,601,627-633
de dimensión fita, 295-298
de dimensión infinita, 295
definición de, 258-259
dimensión de, 298
reales, 257-258,601
subespacio de un, 265
Espacio vectorial con producto
interior, 339
distancia en un, 341-342,639
norma en un, 341-342,639
Espacio vectorial de dimensión finita,
295-298
Espacio vectorial real con producto
interior, 339-340
Espacios vectoriales complejos, 258,
601,
627-628
Espacios vectoriales de dimensión
infinita,
295
hpacios vectoriales generales, 257-337
Expansión (o compresión), 522-523
Fase. hacia adelante, 580
Fase hacia atrás, 580
Forma cuadrática, 551-558
indefinida, 557
negativa definida, 557
negativa semidefinida, 557
positiva d e f i d a , 555
positiva semidefinida, 557
Forma cuadrática asociada, 55 1-552,
563,574
Forma escalonada, 29-30,33-34
Forma escalonada reducida, 29-30,
33-34, 124
Forma general de un plano, 191
Forma lineal, 55 1
Forma polar, 617-6 18
Fórmula de De Moivre, 622-623
Fourier, Jean Baptiste Joseph, 548
Función con valores complejos, 628-629
integral de una, 639
Función(es):
con valores complejos, 628-629
con valores vectoriales, 447
continuas, 267
determinante, 112
dominio de una, 2 18
iguales, 218
valor de una, 32
Invariante bajo semejanza, 499
Inversa:
deunamatriz, 66-68,85,137-139
de una matriz 2 X 2,66,68
Inversión en una pennutación, 109
Inverso aditivo, véase Negativo de
un vector
Jordan, Wilhelm, 34
Kernel, 46 1
Lagrange, Joseph Louis, 176
Ley conmutativa:
para la adición, 62
para lamultiplicación, 62
Ley de cancelación, 64
Leyes asociativas, 62
Leyes distributivas, 23
Longitud euclidiana, 207, 633
Longitud (norma) de un vector, 161,
207,
343,633
Mapeos, 218,240
MathemahcsMagmme, 34
Matrices de Dirac, 609
Matrices iguales, 22
Índice / 713
negativa semidefinida, 557
normal, 220-22 1
notación para vectores, 2 12-213
orden de una, 48
ortogonal, 62
positiva d e f ~ d a 555
,
positiva semidefinida, 555
producto de, 49-50
rango de una 323-324,336
renglones de una, 47
semejante, 498-499
Simétrica, 97-98,437
suma de, 49
sustracción de, 49
tamaño de una, 47
transpuesta de una, 57-58
traza de una, 104
triangular, 95
triangular inferior, 95
triangular superior, 95
unitaria, 647-649
Matrices semejantes, 498-499
Matriz acompañante, 444
Matriz antisimétrica, 102
Matriz aumentada, 25,327
Matriz cuadrada, 48
Matriz de coeficientes, 56,327
Matriz de Householder, 105
Matriz de transición, 401
Matriz diagonal, 94,495
Matriz diagonalizable ortogonalmente,
437
Matriz diagonalizable unitariamente,
649
Matriz elemental, 75-78
Matriz hermitiana, 649-650
Matriz identidad, 65
Matriz (matrices):
acompañante, 444
anticonmutativa, 609
aumentada, 25,327
antisimétrica, 102
cero, 64
columnas de una, 47
con elementos complejos, 607
conjugada transpuesta de una, 646
cuadrada, 48
de coeficientes, 56,327
de cofactores, 136-137
de coordenadas, 287-291
de Householder, 105
de transformación, 218,447
de transición, 40 1
de una transformación lineal, 481496
definición de, 24, 47
diagonal, 666,495
diagonal principal de una, 49
diagonalizable, 426,438, 649
diagonalizable odogonalmeente, 437
diagonalizable unitariamente, 649
diagonalizable ortogonalmente, 437
diagonalizable unitariamente, 649
elemental, 75-76
elementos en una, 47
equivalente por renglones, 80,81
espacio columna de una, 47
espacio renglón de una, 307
forma escalonada de una, 29-30,
33-34
forma escalonada reducida de una,
29-30, 33-34, 124
hermitiana, 647,649
indefinida, 557
identidad, 65
igualdad de, 49
inversa, 66-68, 85
inversión de, 80
invertible, 66-68, 85, 137-139
multiplicación por un escalar de una,
49-50
negativa d e f ~ d a557
,
1 X 1.47
Matriz i n d e f ~ d a557
,
Matriz invertible, 66-68,85, 137-139
Matriz normal, 220-22 1
Matriz ortogonal, 395
Matriz simétrica, 97-98,437
Matriz triangular, 95
Matriz triangular inferor, 95
Matriz triangular superior, 95
Matriz unitaria, 647-648
Medida euclidiana, 217
Mejor aproximación, 384-385
Menor, 131
M . 131
M":,
260
Módulo, 610
Muestra:
media de la, 560
variancia de la, 560
Multiplicación por.4 (como una
trasfomación):
defmición), 220
espacio nulo, 307
recorrido, 46 1
Multiplicación de números complejos,
604,609
Multiplicación por bloques, 59
Multiplicidad algebraica, 433
Multiplicidad geométrica, 433
Múltiplo escalar, 49-50,204,257-258,
630
n-ada ordenada, 203
Negativa definda, 557
Negativa semidef~da,557
Negativo:
de un número complejo, 604
de un vector, 15 1
Nilpotente, 44
Norma, 161,207,343,633
Norma euclidiana, 207,633
Normal a un plano, 189-190
Normalización de un vector, 367-368
Nulidad de una transformación, 463-465
Número complejo imaginario puro, 604
Número(s) complejo(s), 258,418-419,
601-606
argumento de,6 18
argumento principal de, 6 18
conjugado de un, 6 1O, 6 14-615
división de, 6 11-6 13
forma polar de, 6 17-618
imaginario(s) puro(s), 604
iguales, 604
módulo de, 610
multiplicación de, 604,605
negativo de, 604
parte imaginaria de, 419,602,603
parte real de, 603
raíces de, 622-625
suma de, 604-605
sustracción de, 604
valor absoluto de, 61 1
Número imaginario, 602
Números complejos iguales, 604
Operador identidad, 222,448
Operador lineal, 219,447
determinante de un, 499
matriz de un, 481-490
Operador proyección, 225
Operador rotacional, 228
Operaciones (elementales) en los
renglones, 26
Operaciones inversas, 76-77
Operaciones normales en R", 205
Operadores reflexión, 223
Orden:
de una matriz cuadrada, 49
de un polinomio trigonométrico, 546
Origen, 153
Par ordenado, 203-204
Parribola, 565
Paraboloide elíptico, 575
Paralologramo, 181
Parte imaginaria, 418,602,603
Parte real, 603
Pase hacia adelante, 580
Pase hacia atrás, 580
Permutación, 108
inversión en una, 109
Permutación impar, 109
Permutación par, 109
Pesos, 333
Pitágoras, teorema generalizado, 358
Plano:
ecuación general del, 191
forma punto-normal, 190
forma vectorial del, 193
Plano complejo, 603
714 / hdice
Plano xy, 154
Plano xz, 154
Planoyr, 154
Pohnomio característico, 416,649
Polinomio mónico, 444
Polinomio trigonométrico, 546
orden de un, 546
Polinomios de Legenbre, 384
Polinomios de Legendre normalizados,
3 84
Posición normal, 564,574
Positiva definida, 555
matriz, 5 5 5
Positiva semidef~da,557
principal, 21.28
Problema con valor inicial, 514
Proceso de Gram-Schmidt, 375-376,
ecuaciones paramétricas de la, 37194
ecuaciones siqétricas de la, 202
forma vectorial de la, 195
Reducción de Kronecker, 563
Reducción de Lagrange, 563
Reflexiones, 222-226
Regla de Cramer, 139-142
Regla de la mano derecha, 179
Regla de la mano izquierda, 179
R", 292
base normal de, 292
Renglón, 47
Retrosustitución hacia atrás, 36-38
Rotación:
de ejes, 404-407
de vectores, 227-230
440441,640-641
Producto:
de matrices, 49-50
de matrices invertibles, 68
de números complejos, 604,605
de un vector por un escalar,
151-152,204,257-258
Producto cruz de vectores,
175-187
Producto elemental, 110
con signo, 111
Producto elemental con signo, 111
Producto interior:
axiomas del, 339,637
euclidiano, 164, 205,631
Producto interior euclidiano, 164,206,
637-641
como producto de matrices, 2 12-2 13
ponderado, 272
propiedades de, 164, 167-169,63 1
Producto interior euclidiano ponderado,
340
Producto punto, véase producto interior
euclidiano
Promedio aritmético (media), 341
Proyección ortogonal, 169,372
operador, 225
Punto inicial, 131, 149
Punto-normal, 190
Punto terminal, 149
Puntos e n F , 203-205
Raíces latentes, 127
Raíz (de un número o complejo), 621625
Raíz n-ésima, 622-625
Rango:
de una matriz, 322-323,336
de una transformación, 462
9,291
base normal de, 29 1
Recorrido, 461
Recta:
Schmidt, Erhardt, 376
Schwan, Hermann Amandus, 208
Sección cónica (cónica), 563-572
degenerada, 564,573
no degenerada, 564
Sección cónica degenerada, 564,573
Series de Fourier, 546-549
Sistema consistente, 38,56,90,307
Sistema de coordenadas derecho, 154,
180
Sistema de coordenadas rectangulares,
154-155
Sistema de ecuaciones lineales, 21-25
consistente, 23,38,90,307
inconsistente, 23
solución de un, 22
Sistema homogéneo, 38-40,269
Sistema inconsistente, 23
Sistema lineal, 22
Sistema lineal indeterminado, 33 1
Sistema lineal sobredeterminado, 331
Sistema normal, 387
Solución:
conjunto, 23
de un sistema, 22
de una ecuación lineal, 23
espacio, 269
Solución general, 309, 513
Solución trivial, 38
Soluciones no triviales, 38
Soluciones particulares, 309, 514
Subespacio, 265,628
Submatrices principales, 556
Submabiz, 32
Suma:
de cuadrados, 562
de matrices, 50
de números complejos, 604-605
de vectores, 150,205,257-258
Superficie cuádrica, 574-578
Sustitución hacia adelante, 591
Sustracción:
de matrices, 49
de números complejos, 604
de vectores, 15 1,205
Tamaiío de una matriz, 47
Teorema alternativo de Fredholm, 509
Teorema de Cayley-Hamilton, 443
Teorema de la dimensión, 464
Teorema de la mejor aproximación, 384
Teorema de los ejes principales:
para R2,569-570
p a r a 9 , 577
Teorema de proyección, 372
Teorema de Piagoras generalizado, 358
Términos del producto cruz, 552,
565-568
Transformación lineal, 220,22 1
matriz de una, 481-496
Transformaciones inversas, 468-474
Transpuesta, 401
propiedades de la, 71
Traza de una matnz,104
Triple producto escalar, 181
Tripleta ordenada, 203
Valor absoluto, 610
Valores caracteristicos, 127
Valores propios, 127
Variables libres, 30
Variables principales, 30
Vedofles), 149,202,203-337,
627-646
adición de, 150,204,257-258,627
ángulo entre, 164,356
cero, 150,204
combinación lineal de, 270,627
componente vectorial a lo largo de
un, 170-173
componente vectorial ortogonal a un,
169-171
columna, 306
de coordenadas, 399
d e f ~ c i ó nde, 257-258
descomposiciónde, 170
diferencia de, 205
destancia entre, 206-207,341-342,
633
en o", 628-633
en R", 203-2 15
equivalentes, 150
iguales, 150,204
imagen de un, 2 19
inverso aditivo,de, véase vectotfes),
negativo de
linealmente dependientes,
,
277-279
linealmente independientes,
279-287,628
longitud de un, 161,207,
342,633
múltiplo escalar de un, 204,
257-258,630
Indice 1 715
negativo de un, 15 1
norma de un, 161,207,342,633
norma euclidianade, 207,633
normalización de,367-368
ortogonal, 167-168,357-359,640
ortonormal, 367,640
producto cruz de, 175-176
punto inicial de. un, 131, 149
punto terminal de un, 149
renglón, 306
solución, 269-270
unitario normal, 178-179
Vectores equivalentes, 150
Vectores iguales, 150,204
Vectores linealmente dependientes
(conjunto de), 277-279
Vectores geométricos, 149-152
Vectores linealmente independientes
(conjunto de),277
Vectores normales unitarios,
178-179
Vectores ortogonales, 167-168,
357-358,640
Vectores renglón, 306
Wronskiano, 334
Yuster, Thomas, 34
LA EDICIóN,
COMPOSICION, DISEÑO E IMPRESION DEESTA OERA FUERON REALIZADOS
SUPERVISION DE GRUPO NORIEGA EDITORES.
BALDERAS
95, COL.CENTRO.
MCxlco, D.F. C.P. 06040
1200095000801522DP92001E
BAJO LA
Descargar