1 CAPÍTULO 5 ECUACIONES NO LINEALES Evaluación de funciones. Métodos de evaluación de funciones: Método de bisección Regula Falsi Punto fijo Newton–Rapson Secante a) polinómicas, b) series, c) exponenciales, d) logarítmicas, e) trigonométricas, f) hiperbólicas, g) funciones arco, etc. Estimación de errores en la evaluación. Resolución numérica de ecuaciones. 2 CAPÍTULO 5 ECUACIONES NO LINEALES INTRODUCCION Uno de los problemas que frecuentemente ocurren en los trabajos científicos es calcular las raíces de una determinada ecuación de la forma 𝑓(𝑥) = 0. Donde 𝑓(𝑥) puede ser un polinomio en 𝑥 o una función trascendente. En algunos casos es posible hallar la raíz exacta de 𝑓(𝑥) = 0, esto ocurre con los polinomios factorables. Por medio de métodos numéricos es posible obtener una solución aproximada, en algunos casos, tan próxima como se desee de la solución exacta. La mayoría de los procedimientos numéricos generan una secuencia de aproximaciones, algunas con mayor precisión que otras, algunas aproximándose con mayor rapidez a la solución buscada, de tal forma que la repetición de procedimientos produce una aproximación al valor verdadero definido por una tolerancia prefijada. Estos procedimientos son semejantes al concepto de límite del análisis matemático, pues normalmente el resultado obtenido de una operación por medio de métodos numéricos se acerca tanto como se desee al valor verdadero, sin llegar casi nunca al valor exacto. Para el inicio del estudio de las funciones o ecuaciones no lineales es importante contar con algunas herramientas fundamentales para el estudio de las funciones no lineales. Una característica principal de los métodos numéricos es que casi nunca arrojan resultados exactos, por lo tanto, en la mayoría de los casos, si no en todos, se obtienen resultados aproximados, que siempre dependerán de la precisión que se desee. Teorema 5.1. Si una función continua 𝑓(𝑥) asume valores de signos opuestos en los puntos extremos del intervalo [𝑎, 𝑏], esto es, si 𝑓(𝑎) × 𝑓(𝑏) < 0, entonces existe por lo menos un punto 𝑥 ∗ ∈ [𝑎, 𝑏], tal que 𝑓(𝑥 ∗ ) = 0. Este teorema se presenta sin demostración.1 Teorema 5.2. Teorema de Descartes El numero de raíces positivas de una ecuación 𝑓(𝑥) = 0 es menor o igual que el numero de variaciones de signo en 𝑓(𝑥). El numero de raíces negativas es menor o igual que el numero de variaciones de signo en 𝑓(−𝑥). (Cada raíz se cuenta tantas veces como indica su orden de multiplicidad). Este teorema se presenta sin demostración.2 1- La demostración de este teorema en: Velázquez Zapateiro, Jorge y Obeso Fernández, B. 2007. Análisis Numérico, Notas de clase. Colombia. Pág. 28 2. La demostración de este teorema en: Bernis, Francisco. Malet, Antonio. Molinas, Cesar. 1983. Matemáticas. Editorial Noger S.A. Madrid, España. Pág. 468. 3 Teorema 5.2. Teorema de Bolzano Sean 𝑎 < 𝑏 y sea 𝑓(𝑎) × 𝑓(𝑏) < 0 (𝑓(𝑎) 𝑦 𝑓(𝑏) tienen signos opuestos). Entonces 𝑓 tiene en [𝑎, 𝑏] un número impar de raíces. Si 𝑓(𝑎) × 𝑓(𝑏) > 0, entonces 𝑓 tiene un numero par de raíces en [𝑎, 𝑏] (y en particular puede tener cero). Cada raíz se cuenta tantas veces como indica su orden de multiplicidad. Este teorema se presenta sin demostración.3 Teorema 5.2. Teorema de Fermat Si 𝑓(𝑐) es un punto extremo de una función 𝑓 en un intervalo [𝑎, 𝑏], 𝑐 está en el interior de [𝑎, 𝑏] y 𝑓(𝑐) existe, entonces 𝑓 ′ (𝑐) = 0. Este teorema se presenta sin demostración.4 Teorema 5.3. Si 𝑓 es continua en un intervalo cerrado [𝑎, 𝑏]; entonces existe un punto 𝑥0 ∈ [𝑎, 𝑏] para el cual 𝑓(𝑥0 ) ≥ 𝑓(𝑥) ∀𝑥 ∈ [𝑎, 𝑏]. La demostración de este teorema se deja como ejercicio al lector. Teorema 5.4. Si 𝑓 es continua en un intervalo cerrado [𝑎, 𝑏]; entonces existe un punto 𝑥′0 ∈ [𝑎, 𝑏] para el cual 𝑓(𝑥′0 ) ≤ 𝑓(𝑥) ∀𝑥 ∈ [𝑎, 𝑏]. Teorema 5.5. Teorema de Rolle Si 𝑓 es continua en un intervalo cerrado [𝑎, 𝑏]; diferenciable en el intervalo abierto (𝑎, 𝑏) y 𝑓(𝑎) = 𝑓(𝑏), entonces existe un número 𝑐 ∈ (𝑎, 𝑏), tal que 𝑓 ′ (𝑐) = 0 Este teorema se presenta sin demostración.5 Teorema 5.5’. Teorema de Rolle Entre dos raíces consecutivas de una ecuación algebraica 𝑓(𝑥) = 0, existe un numnero impar de ceros de la derivada 𝑓′, contando cada uno de ellos tantas veces como indique su orden de multiplicidad. Corolario Entre dos raíces consecutivas de la derivada no pueden existir dos raíces distintas de 𝑓(𝑥) = 0, porque si existieran, 𝑓′ tendría una raíz intermedia. Teorema 5.6. Teorema del Valor Medio Si 𝑓 es continua en un intervalo cerrado [𝑎, 𝑏] y diferenciable en el intervalo abierto (𝑎, 𝑏) existe un número 𝑐 ∈ (𝑎, 𝑏), tal que 𝑓(𝑏) − 𝑓(𝑎) = 𝑓 ′ (𝑐)(𝑏 − 𝑎) 3. La demostración de este teorema en: Bernis, Francisco. Malet, Antonio. Molinas, Cesar. 1983. Matemáticas. Editorial Noger S.A. Madrid, España. Pág. 469. 4. La demostración de este teorema en: Velázquez Zapateiro, Jorge y Obeso Fernández, B. 2007. Análisis Numérico, Notas de clase. Colombia. Pág. 28. 5. La demostración de este teorema en: Velázquez Zapateiro, Jorge y Obeso Fernández, B. 2007. Análisis Numérico, Notas de clase. Colombia. Pág. 29. 4 Este teorema se presenta sin demostración.6 Teorema 5.7. Teorema del valor Intermedio Si 𝑓 es continua en un intervalo cerrado [𝑎, 𝑏], 𝑓(𝑏) ≠ 𝑓(𝑎) y 𝑘 un numero cualquiera entre 𝑓(𝑎) y 𝑓(𝑏), entonces existe un numero 𝑐 ∈ (𝑎, 𝑏), tal que 𝑓(𝑐) = 𝑘 Este teorema se presenta sin demostración.7 Preguntas siguientes: 1. >Cómo se elige la aproximación inicial x0? 2. >Cómo se construye la sucesión fxk g de aproximaciones? 3. >Cómo se decide si xk es una aproximación suficientemente buena a x_? Estas preguntas se responden a lo largo del capítulo. De momento, y para terminar este apartado de introducción, se presentan dos ejemplos de la ecuaci_on 5.1. 5 Definición 5.1. Si 𝑓: [𝑎, 𝑏] → ℝ es una función dad, un punto 𝑥 ∗ ∈ [𝑎, 𝑏] es un cero (o raíz) de 𝑓 si 𝑓(𝑥 ∗ ) = 0 Grafica de funciones, un método para hallar intervalos. Las graficas ayudan enormemente en la búsqueda de los ceros o raíces de una función, pues si no se conoce el intervalo que contiene la raíz de dicha función, es difícil iniciar cualquier proceso en búsqueda de solución. Seguidamente se presentan algunas graficas y las explicaciones que necesarias para adentrarse a la solución de ecuaciones no lineales. Ejemplo 5.1. Hallar el intervalo que contiene una raíz de la función 𝑓(𝑥) = 𝑒 −𝑥 − cos 𝑥 Solución 1 Se grafica la función 𝑓(𝑥) = 𝑒 −𝑥 − cos 𝑥 6. La demostración de este teorema en: Velázquez Zapateiro, Jorge y Obeso Fernández, B. 2007. Análisis Numérico, Notas de clase. Colombia. Pág. 29. 7. La demostración de este teorema en: Velázquez Zapateiro, Jorge y Obeso Fernández, B. 2007. Análisis Numérico, Notas de clase. Colombia. Pág. 30. 5 y 1.5 1 0.5 x -1 -0.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 -0.5 -1 Fig. 5.1. -1.5 Según la grafica de la función, se tiene una raíz en el intervalo [1; 1.5] y otra raíz en [4.5; 5]. Observación: Al ser cos 𝑥 una función periódica, esta ecuación tiene infinitas soluciones. Solución 2 Sea la función 𝑓(𝑥) = 𝑒 −𝑥 − cos 𝑥 = 0, implica que 𝑒 −𝑥 − cos 𝑥 = 0, Si 𝑒 −𝑥 − cos 𝑥 = 0, ⟹ 𝑒 −𝑥 = cos 𝑥, si 𝑦1 = 𝑦2 −𝑥 𝑦1 = 𝑒 y 𝑦2 = 𝑐𝑜𝑠 𝑥. Se grafican en un mismo plano, se tiene la fig. 5.1. 2 y 𝒚𝟏 = 𝒆−𝒙 1.5 𝒚𝟐 = 𝒄𝒐𝒔 𝒙. 1 0.5 x 0.5 1 1.5 2 2.5 -0.5 La intersección de las dos curvas es un cero de la función sobre 𝑥, lo cual indica que uan raíz se encuentra en el intervalo [1; 1.5], como en el caso anterior. Comentarios Si se realiza la grafica a escala y ésta está bien definida (una grafica muy bien hecha), se puede estimar un intervalo más reducido como [1.2; 1.4], con esto se aceleraría notablemente el proceso de llegar a la aproximación más deseada, pues se usaría menos iteraciones, o sea, se resolvería el ejercicio en menor paso. Gráficamente, los ceros de una función son los puntos de intersección de la grafica 𝑦 = 𝑓(𝑥) con el eje de las 𝑥. 6 5.1.1. Métodos cerrados Los métodos numéricos que en cada paso dan un intervalo cerrado donde se encuentra la raíz buscada, son llamados métodos cerrados. Entre los más conocidos se encuentran el método de bisección y el método de la falsa posición o Regula Falsi. 5.1. Método de bisección Definición 5.1. Sea f una función continua en un intervalo [𝑎, 𝑏] y 𝑓(𝑎) × 𝑓(𝑏) < 0. Entonces, por el teorema del valor intermedio para funciones continuas, existe al menos un 𝛼 ∈ (𝑎, 𝑏) tal que 𝑓(𝛼) = 0. El método de la bisección es un algoritmo de búsqueda de raíces que aplicando la función 𝑓 para aproximar la raíz 𝛼 ∈ [𝑎, 𝑏] consiste en dividir sucesivamente al intervalo a la mitad y seleccionando el sub-intervalo que tiene la raíz. Es un método de búsqueda incremental que divide el intervalo siempre en 2. Si la función cambia de signo sobre un intervalo, se evalúa el valor de la función en el punto medio. La posición de la raíz se determina situándola en el punto medio del subintervalo donde exista cambio de signo, basándose en el teorema de Bolzano. El proceso se repite hasta mejorar la aproximación. Supóngase que se desea resolver la ecuación 𝑓(𝑥) = 0, donde f es una función continua. Dados dos puntos a y b tal que f(a) y f(b) tengan signos distintos, es sabido por el Teorema de Bolzano que f debe tener, al menos, una raíz en el intervalo [a, b]. El método de bisección divide el intervalo en dos, usando un tercer punto c = (a+b) / 2. En este momento, existen dos posibilidades: f(a) y f(c), ó f(c) y f(b) tienen distinto signo. El algoritmo de bisección se aplica al sub-intervalo donde el cambio de signo ocurre. El método de bisección no es muy eficiente, pero es mucho más seguro que otros métodos de aproximación de raíces, pues siempre converge hacia el valor buscado. Si f es una función continua en el intervalo [a, b] yf(a)f(b) < 0, entonces este método converge a la raíz de f. De hecho, una cota del error absoluto es: |𝑏−𝑎| 2𝑛 Encontrar dos números a y b con a b en los cuales el polinomio P toma valores cuyos signos son distintos. Considerando que x1 ab es el punto medio del intervalo [a, b]. 2 Si P(x1) = 0, x1 es la raíz buscada, si P(x1) 0 entonces: Se elige uno de los intervalos [a, x1] o [x1, b] de tal manera que los extremos del intervalo del polinomio tome valores cuyos signos sean distintos. Se repite el procedimiento en el intervalo elegido. Observaciones: La longitud del intervalo es una estimación del error cometido al aproximar la raíz. 7 La única restricción para elegir a y b es que los valores P(a) y P(b) tengan signos distintos, en general, entre más pequeña sea la longitud del intervalo, en menor número de pasos se encontrará la aproximación deseada. Este método se aplica en la busca de raíces tanto racionales como irracionales. Teorema 5.7. Teorema de Weierstrass Una sucesión creciente y acotada superiormente tiende a un límite, y una sucesión decreciente y acotada inferiormente tiende a un límite. Teorema 5.8. Teorema de convergencia Sea 𝑓 ∈ [𝑎, 𝑏] 𝑦 𝑓(𝑎)𝑓(𝑏) < 0. Sea {𝑐𝑛 }∞ 𝑛=0 la sucesión de puntos medios generada por el método de búsqueda binaria (método de bisección). Existe 𝑟 ∈ [𝑎, 𝑏], tal que 𝑓(𝑟) = 0 y además: 𝑏−𝑎 |𝑟 − 𝑐𝑛 | ≤ 𝑛+1 , en particular {𝑐𝑛 }∞ 𝑛=0 coverge a 𝑟 2 Este teorema se presenta sin demostración.8 Ejemplo 5.1. Aproximar con al menos una cifra exacta la raíz del polinomio 𝑃(𝑥) = −6𝑥 3 + 𝑥 − 6. Solución: Para encontrar el intervalo que contiene una raíz de la función, la forma más simple es graficando dicha función. Fig. 5.1. y 2 1 x -2.5 -2 -1.5 -1 -0.5 0.5 1 1.5 2 2.5 -1 -2 -3 -4 -5 -6 8. La demostración de este teorema en: Velázquez Zapateiro, Jorge y Obeso Fernández, B. 2007. Análisis Numérico, Notas de clase. Colombia. Pág. 39. 8 Fig. 5.1. Según la grafica, una raíz de la ecuación se encuentra en el intervalo [– 2, – 1]. Se inicia la búsqueda de la raíz de este polinomio en el intervalo [– 2, – 1]. Sea el polinomio 𝑃(𝑥) = −6𝑥 3 + 𝑥 − 6 Evaluando en 𝑃(−2) = −6(−2)3 + (−2) − 6 = 40 > 0 𝑃(−1) = −6(−1)3 + (−1) − 6 = −1 < 0 𝑃(−2) 𝑃(−1) + − Así: El punto medio del intervalo [– 2, – 1] es x1 2 1 3 = – 1,5 2 2 Evaluando en 𝑃(−1,5) = −6(−1,5)3 + (−1,5) − 6 = 20,25 − 1,5 − 6 = 12,75 > 0 𝑃(−2) 𝑃(−1,5) + + 𝑃(−1) − La raíz se encuentra en el intervalo [−1,5; −1]. La longitud del intervalo es: −1 + 1,5 = 0,5 El punto medio del nuevo intervalo es: x2 1,5 1 2,5 = – 1,25 2 2 Evaluando en P(–1,25) = – 6 (– 1,25)3 + (–1,25) – 6 = 11,719 – 1,25 – 6 = 4,469 0 P(– 1,5) P(– 1,25) P(– 1) + + – La raíz se encuentra en [– 1,25; – 1]. La longitud del intervalo es: – 1 + 1,25 = 0,25 Se repite el procedimiento: x3 1,25 1 2,25 = – 1,125 2 2 Evaluando en P(–1,125) = – 6 (– 1,125)3 + (–1,125) – 6 = 8,543 – 1,125 – 6 = 1,418 0 P(– 1,25) P(– 1,125) P(– 1) + + – La raíz se encuentra en el intervalo [– 1,125; – 1]. La longitud del intervalo es: 0,125 De manera análoga x4 1,125 1 2,125 = – 1,0625 2 2 9 Evaluando P(–1,0625) = – 6(– 1,0625)3 + (–1,0625) – 6 = 7,1968 – 1,0625 – 6 = 0,1343 0 P(– 1,025) P(– 1,0625) P(– 1) + + – La raíz se encuentra en el intervalo [– 1,0625; – 1]. La longitud del intervalo es: 0,0625 Repitiendo un paso más el mismo procedimiento, se obtiene la siguiente tabla: Intervalo [– 2; – 1]. [– 1,5; – 1]. [– 1,25; – 1]. [– 1,125; – 1]. [– 1,0625; – 1]. [– 1,0625; – 1,0313]. Punto medio xn – 1,5 – 1,25 – 1,125 – 1,0625 – 1,0313 – 1,0468 P(xn) 12,75 4,46 1,418 0,134 – 0,45008 – 0,16436 signo + + + + – – Error 1 0,5 0,25 0,125 0,0625 0,03125 Como −1,0625 y − 1,0313 tienen un 0 en la primera cifra decimal, cualquier punto intermedio lo tiene, es decir, la primera cifra decimal de la raíz buscada es cero, lo cual asegura que la aproximación obtenida tiene una cifra decimal exacta. Comentario Una desventaja es que en general la convergencia es muy lenta, la bisección necesita, para obtener una buena aproximación, muchos más pasos que cualquiera de los otros métodos que veremos después. Pero estos métodos, para converger, necesitan que la primera aproximación que se toma, c1, esté cerca de la solución exacta de la ecuación. En consecuencia, el procedimiento usual es éste: se usan unos pocos pasos de la bisección para acercarse a c y a partir de allí se usa cualquiera de los otros métodos de convergencia rápida. Método de Regula Falsi o Falsa Posición Este método de aproximación de raíces es similar al método de bisección en el sentido de que se generan sub-intervalos [𝑎𝑛 , 𝑏𝑛 ] que encierran a la raíz 𝛼, pero esta vez, 𝑥𝑛 no es el punto medio de [𝑎𝑛 , 𝑏𝑛 ], sino el punto de intersección de la recta que pasa por los puntos (𝑎𝑛 , 𝑓(𝑎𝑛 )); (𝑏𝑛 , 𝑓(𝑏𝑛 )) con el eje 𝑥. 10 Al reemplazar la curva por una recta se obtiene una posición falsa de la raíz, de ahí el nombre el método. Este método también se conoce como método de interpolación lineal inversa. En la figura 5.1 se grafica el método (b, 𝑓(𝑏)) 𝑦 = 𝑓(𝑥) a=a1 x1 =c x2 𝛼 b=b1 Fig. 5.1 (𝑎, 𝑓(𝑎)) Sea 𝑓(𝑎)𝑓(𝑏) < 0 y considerando la recta que une los puntos (𝑎, 𝑓(𝑎)), (b, 𝑓(𝑏)) cuya 𝑓(𝑏)−𝑓(𝑎) , 𝑏−𝑎 𝑎−𝑓(𝑏) también 𝑚 = 𝑐−𝑎 , pendiente es 𝑚 = pero si (c, 0) es el punto de intersección de la recta X, entonces luego: 𝑓(𝑏) − 𝑓(𝑎) 0 − 𝑓(𝑏) = , 𝑏−𝑎 𝑐−𝑏 𝐴𝑠𝑖: 𝑐 = o sea 𝑐−𝑏 = −𝑓(𝑏)(𝑏 − 𝑎) 𝑓(𝑏)(𝑏 − 𝑎) ,⟹ 𝑐 = 𝑏 − 𝑓(𝑏) − 𝑓(𝑎) 𝑓(𝑏) − 𝑓(𝑎) 𝑏𝑓(𝑏) − 𝑏𝑓(𝑎) − 𝑏𝑓(𝑏) + 𝑎𝑓(𝑏) 𝑎𝑓(𝑏) − 𝑏𝑓(𝑎) , 𝑜: 𝑐 = 𝑓(𝑏) − 𝑓(𝑎) 𝑓(𝑏) − 𝑓(𝑎) Así como el método de bisección, este método de falsa posición, también tienen tres posibilidades: 𝑓(𝑐) = 0, 𝑓(𝑎)𝑓(𝑐) < 0, 𝑓(𝑏)𝑓(𝑐) < 0 a) Si 𝑓(𝑐) = 0, entonces c es un cero de 𝑓. b) Si 𝑓(𝑎)𝑓(𝑐) < 0, entonces existe un cero de 𝑓 en [𝑎, 𝑐]. c) Si 𝑓(𝑐)𝑓(𝑏) < 0, entonces existe un cero de 𝑓 en [𝑐, 𝑏]. De todo esto se desprende un proceso iterativo que se concreta generalizándolo en la siguiente expresión matemática. 𝑐𝑛 = 𝑎𝑛 𝑓(𝑏𝑛 ) − 𝑏𝑛 𝑓(𝑎𝑛 ) , 𝑛 = 0, 1, 2, 3, … 𝑓(𝑏𝑛 ) − 𝑓(𝑎𝑛 ) Ejemplo 5.2. Aplicar el método de falsa posición para encontrar un cero de 𝑓(𝑥) = ln 𝑥 + 𝑥, en el intervalo [0.5; 1] Solución Sea la función 𝑓(𝑥) = ln 𝑥 + 𝑥, 11 Inicio: Se construye una tabla por mejor organización de los datos. 𝑓(𝑎) 𝑎 𝑏 𝑓(𝑏) 0.5 −0.1931472 1 1 𝑐𝑛 = 𝑎𝑛 𝑓(𝑏𝑛 ) − 𝑏𝑛 𝑓(𝑎𝑛 ) 𝑓(𝑏𝑛 ) − 𝑓(𝑎𝑛 ) 𝑐1 = 0.5 × 1 − 1 × (−0.1931472) 0.5 + 0.1931472 0.6931472 = = = 𝟎. 𝟓𝟖𝟎𝟗𝟒 1 − (−0.1931472) 1.1931472 1.1931472 ⟹ 𝑐1 = 𝑎𝑓(𝑏) − 𝑏𝑓(𝑎) 𝑓(𝑏) − 𝑓(𝑎) Iteración 1: Reorganizando los datos en una segunda tabla se tiene: 𝑓(𝑎) 𝑓(𝑐1 ) 𝑎 𝑏 𝑓(𝑏) 𝑐1 0.5 −0.1931472 1 1 0.58 0.0352728 Para esta siguiente operación, se toma el intervalo cerrado [𝑎, 𝑐1 ], pues poseen signos contrarios uno respecto del otro y se cumple el teorema de Bolzano 𝑓(𝑐1 )𝑓(𝑎) < 0 𝑐2 = 𝑎𝑓(𝑐1 ) − 𝑐1 𝑓(𝑎) 0.5 × 0.0352728 − 0.58 × (−0.1931472) = 𝑓(𝑐1 ) − 𝑓(𝑎) 0.0352728 − (−0.1931472) 𝑐2 = 0.0189975 + 0.112025 0.1310225 = = 𝟎. 𝟓𝟕𝟑𝟔 0.22842 0.22842 Iteración 2: Una nueva reorganización de los datos obtenidos permite la siguiente tabla: 𝑓(𝑎) 𝑓(𝑐1 ) 𝑓(𝑐2 ) 𝑎 𝑐1 𝑐2 0.5 −0.1931472 0.58 0.0352728 0.5736 0.017777 Se toma el intervalo [𝑎, 𝑐2 ], pues poseen signos opuestos, o sea, 𝑓(𝑐2 )𝑓(𝑎) < 0 𝑐3 = 𝑎𝑓(𝑐2 ) − 𝑐2 𝑓(𝑎) 0.5 × 0.017777 − 0.5736 × (−0.1931472) = 𝑓(𝑐2 ) − 𝑓(𝑎) 0.017777 − (−0.1931472) 𝑐3 = 0.0088885 + 0.110789 0.1196775 = = 𝟎. 𝟓𝟔𝟕𝟒𝟔𝟎𝟖𝟖 0.2109 0.2109 Iteración 3: Se construye de nuevo la tabla y se tiene: 𝑓(𝑎) 𝑓(𝑐2 ) 𝑓(𝑐3 ) 𝑎 𝑐2 𝑐3 0.5 −0.1931472 0.5736 0.017777 0.5674608 0.00087498 Realizando un análisis del error del ejercicio se tiene: El valor exacto de 𝑥 para 𝑓(𝑥) = 𝑙𝑛 𝑥 + 𝑥 , es: 𝟎. 𝟓𝟔𝟕𝟏𝟒𝟑𝟐𝟗 12 𝐸 = 𝑉𝑣 − 𝑉𝑎 = 0.56714329 − 0.5674608 = 𝟎. 𝟎𝟎𝟎𝟑𝟏𝟕𝟓 = 𝟑. 𝟏𝟕𝟓 × 𝟏𝟎−𝟒 𝐸𝑟 = 𝐸 𝑉𝑣 − 𝑉𝑎 0.0003175 = = = 𝟎. 𝟎𝟎𝟎𝟓𝟓𝟗𝟖𝟒 = 𝟓. 𝟓𝟗𝟖𝟒 × 𝟏𝟎−𝟒 𝑉𝑣 𝑉𝑣 0.56714329 𝑉𝑣 − 𝑉𝑎 (%) = 100 × 𝟓. 𝟓𝟗𝟖𝟒 × 𝟏𝟎−𝟒 (%) = 𝟎. 𝟎𝟓𝟓𝟗𝟖% 𝑉𝑣 Este ejercicio tiene una precisión de tres decimales, o sea los primeros tres decimales corresponden al valor exacto o valor verdadero. 𝐸% = 100 ×𝐸𝑟 (%) = 100 × Ejemplo 5.2. Aplicar el método de falsa posición para encontrar un cero de 𝑓(𝑥) = 𝑥 4 − 2𝑥 3 − 4𝑥 2 + 4𝑥 + 4, en el intervalo [1, 2] Solución 𝑓(𝑥) = 𝑥 4 − 2𝑥 3 − 4𝑥 2 + 4𝑥 + 4 Sean: 𝑎 = 1 y 𝑏 = 2 𝑐 =𝑏− 𝑎𝑓(𝑏) − 𝑏𝑓(𝑎) 1𝑓(2) − 2𝑓(1) =𝑐=𝑏− = 𝑓(𝑏) − 𝑓(𝑎) 𝑓(2) − 𝑓(1) Método de Punto fijo MÉTODOS ABIERTOS A diferencia de los métodos cerrados que requieren de un intervalo que encierre la raíz buscada, los métodos abiertos que se verán a continuación requieren de un solo valor o dos valores iniciales o valores de arranque, que no necesariamente encierran a la raíz, esto hace que algunas veces las sucesiones generadas por estos métodos sean divergentes o se alejen de la raíz de interés, pero tiene la ventaja que cuando convergen lo hacen más rápidamente que las sucesiones generadas por los métodos cerrados. Método de Newton Uno de los métodos más atractivos y populares para la búsqueda de los ceros de una función no lineal es el método de Newton, debido a la rápida convergencia del método, ya que en general es q-cuadrático. Existe varias maneras de deducir el método de Newton, el método a ser presentado se base en el método de iteración lineal. Éste es, sin duda, uno de los métodos más importantes y útiles para el cálculo de raíces. Dada una aproximación inicial de la raíz 𝑥0 , se busca, a partir de 𝑥0 , una aproximación mejor 𝑥1 de la raíz, de la siguiente forma: Se sustituye la función 𝑓(𝑥) por el valor de su desarrollo de Taylor centrado en 𝑥0 hasta el orden 1, es decir: 𝑓(𝑥) = 𝑓(𝑥0 ) + 𝑓 ′ (𝑥0 )(𝑥 − 13 𝑥0 ) que corresponde a un polinomio de grado 1, y a continuación se calcula 𝑥1 como el cero de este polinomio, es decir: 𝑓(𝑥0 ) 𝑓 ′ (𝑥0 ) y por tanto, de forma general, se obtiene, a partir de 𝑥0 una secuencia 𝑥𝑛 de valores que van 𝑥1 = 𝑥0 − aproximando la raíz, definidos por 𝑥𝑛+1 = 𝑥𝑛 − 𝑓(𝑥𝑛 ) 𝑓 ′ (𝑥𝑛 ) Definición. Dada una ecuación 𝑓(𝑥) = 0. Un número 𝛼 se dice una raíz de multiplicidad m (m un entero positivo) de la ecuación 𝑓(𝑥) = 0, si 𝑓(𝛼) = 0. Si m = 1, la raíz se dice simple. Teorema Sea que una función 𝑓 tiene sus dos primeras derivadas continuas en un intervalo [𝑎, 𝑏] que contiene a un número 𝛼. Entonces 𝛼 es una raíz simple de la ecuación 𝑓(𝑥) = 0 si y solo si 𝑓(𝛼) = 0 𝑦 𝑓′(𝛼) ≠ 0. Este teorema se presenta sin demostración.9 Teorema Sea que la función 𝑓 tiene sus primeras 𝑚 + 1 derivadas continuas en un intervalo [𝑎, 𝑏] que contiene a un número 𝛼. Entonces 𝛼 es una raíz de multiplicidad m de la ecuación 𝑓(𝑥) = 0 si y solo si Sea 𝑓 ∈ 𝐶 𝑚+1 [𝑎, 𝑏], una función diferenciable en [𝑎, 𝑏] y sea 𝑥0 ∈ [𝑎, 𝑏], entonces para todo 𝑥 ∈ (𝑎, 𝑏), se sabe por el Teorema de Taylor que 𝑓 se puede escribir de la forma: 𝑓 ′′ (𝑥0 )(𝑥 − 𝑥0 )2 𝑓 ′′ ′(𝑥0 )(𝑥 − 𝑥0 )3 + +⋯ 2! 3! Sea 𝑓(𝑥) = 0 una ecuación y 𝑥0 un primer valor aproximado a una raíz 𝜑 de una ecuación. Este método consiste en obtener una aproximación a 𝜑 calculando el punto en que la tangente de la curva en (𝑥0 ; 𝑓(𝑥0 )) corta al eje X. Gráficamente se ve en la fig. 5.7. 𝑓(𝑥) = 𝑓(𝑥0 ) + 𝑓 ′ (𝑥0 )(𝑥 − 𝑥0 ) + 2 y 1.5 9. La demostración de este teorema en: Velázquez Zapateiro, Jorge y Obeso Fernández, B. 2007. Análisis Numérico, Notas de clase. Colombia. Pág. 57. 1 0.5 x 0.5 1 1.5 2 2.5 3 3.5 14 Fig. 5.7 EJERCICIOS DE FIJACIÓN E) Encuentra las raíces racionales del polinomio en cada caso. 1) 24x3 – 26x2 + 9x – 1 2) 24x3 – 22x2 – 5x + 6 3) x3 + 5x2 – 8x + 3 4) 3x5 – 4x4 – 2 5) 5x5 – 2x2 – 6x – 5 6) x5 – 6x3 – 5x + 5 7) 16x4 + 16x3 – 64x2 – 4x + 15 15 8) 27x4 + 63x3 – 57x2 – 7x + 6 9) 7x4 – 4x3 + 3x2 – 20x – 9 10) 40x4 + 202x3 + 3x2 – 34x + 5 11) 30x4 – 67x3 + 7x2 + 16x – 4 12) –5x5 + 4x3 – 11x2 + 17 13) 2x4 – 13x3 – 83x2 + 442x + 240 14) 36x5 – 12x4 – 95x3 – 50x2 – x + 2 15) 19x7 + 21x6 – 34x4 + 42x3 – 13x2 – 27x + 71 16) 64x5 – 56x4 – 242x3 + 223x2 – 56x + 4 17) 25x6 + 153x4 + 20x5 + 120x3 + 143x2 + 100x + 15 18) 18x6 + 111x5 + 17x4 – 114x3 – 666x2 – 102x + 36 19) 32x7 – 16x6 – 10x5 + 3x4 – 64x3 + 32x2 + 20x – 6 20) 25x6 + 14x5 – 12x4 + 34x3 – 8x2 + 63x – 21 21) x7 – 7x6 – 9x5 + 63x4 + x3 – 7x2 – 9x + 63 22) 24x8 – 10x7 – 3x6 + x5 + 24x3 – 10x2 – 3x + 1 23) 49x8 – 344x6 + 56x4 – 344x2 + 7 24) 16x8 + 12x7 + 12x6 + 73x5 + 44x4 + 45x3 + 36x2 – 16x – 12 25) 48x7 – 2x6 + 157x5 – 8x4 + 4x3 – 6x2 – 105x 26) x7 + 4x6 – 14x5 – 56x4 + 49x3 + 196x2 – 36x – 144 27) 54x7 + 9x6 – 294x5 – 49x4 + 444x3 + 74x2 – 144x – 24 28) 35x9 + 16x8 + 15x7 – 8x6 – 18x5 + 23x4 – 42x3 – 39x2 + 28x – 5 29) 15x9 + 8x8 – 74x7 – 40x6 – 5x5 + 45x4 + 24x3 – 222x2 – 120x – 15 16 F) Evalúa cada polinomio en el punto indicado utilizando la calculadora 30) 6x6 + 2x5 – 12x4 + 5x3 – 4x2 + 10x – 3 en x = – 3 31) X8 – 3x7 + 14x6 – 21x5 – 8x4 – 9x3 + 15x2 + 2x + 6 en x = 2 32) 9x7 + 4x5 + 20x4 – 12x3 + 17x2 – 23x + 35 en x = 4 33) 12x4 – 24x3 + 8x2 – 3x + 26 en x = 1,5 34) 7x9 + 2x4 – 8x – 19 en x = – 1,25 35) Prueba que 36) Prueba que 6 es un número irracional. 3 4 es un numero irracional G) Determina el número de raíces positivas y negativas de cada uno de los polinomios siguientes: 37) P(x) = 2x4 + 3x3 – 7x2 – 12x – 4 38) P(x) = 9x6 – x4 + 9x2 – 1 39) P(x) = – x3 + 9x2 – 15x – 25 40) P(x) = – x5 + 4x3 – x2 + 4 41) P(x) = 6x7 – 23x6 – 5x5 + 4x4 + 6x3 – 23 42) P(x) = 5x7 – 7x6 + 25x – 35 43) P(x) = 3x5 – 2x4 – 15x3 + 10x2 + 12x – 8 44) P(x) = 3x5 + 7x4 – 7x3 – 27x2 – 20x – 4 45) P(x) = 2x6 – 5x5 – 11x4 + 28x3 + 16x2 – 32x – 16 46) P(x) = 16x5 + 52x4 + 68x3 – 11x2 – 41x – 12 47) P(x) = 10x6 – 71x5 + 237x4 – 473x3 + 525x2 – 248x + 20 48) P(x) = 8x5 – 46x4 + 73x3 – 8x2 – 45x + 18 49) P(x) = 16x5 – 277x3 – 5x2 + 336x + 80 17 50) P(x) = 9x5 – 12x4 – 47x3 + 58x2 + 44x – 40 51) P(x) = 36x5 + 60x4 – 35x3 – 80x2 – x + 20 52) P(x) = 64x6 + 88x5 – 306x4 – 253x3 + 356x2 – 84x 53) P(x) = 75x7 + 70x6 + 21x5 + 2x4 + 75x3 + 70x2 + 21x + 2 54) P(x) = 54x7 – 63x6 + 21x5 – 2x4 – 54x3 + 63x2 – 21x + 2 55) P(x) = 125x7 – 150x6 + 55x5 – 6x4 + 250x3 – 300x2 + 110x – 12 56) P(x) = – 49x7 – 378x6 – 251x5 – 42x4 – 49x3 – 378x2 – 251x – 42 H) Mostrar que A es una cota inferior y B es una cota superior para las raíces del polinomio dado y encontrar todas las raíces reales. 57) P(x) = 3x4 – 10x3 – 27x2 + 82x – 24; A = – 4, B=6 58) P(x) = 33x4 – 72x3 + 47x2 – 12x + 1 A = – 1, B=3 59) P(x) = 3x5 – 22x4 + 22x3 + 16x2 – 25x + 6; A = – 2, B=8 60) P(x) = 10x5 + 63x4 – 328x3 + 403x2 – 168x + 20; A = – 11, B=4 61) P(x) = 4x3 – 56x2 + 259x – 396; A = – 1, B = 14 62) P(x) = x4 + 18x3 + 111x2 + 278x + 240; A = – 18, B=1 63) P(x) = x5 + 10x4 + 19x3 + 26x2 + 17x + 8; A = – 10, B=2 64) P(x) = x5 + 7x4 – 3x3 – 21x2 – 4x – 28; A = – 8, B=4 I) Encontrar en cada caso, un número entero que sea cota inferior y uno que sea cota superior de las raíces del polinomio dado. 65) P(x) = x5 + 6x4 – 6x3 – 64x2 – 27x + 90 66) P(x) = x4 – 2x3 – 13x2 + 38x – 24 67) P(x) = x5 + 9x4 + 21x3 + 21x2 + 20x + 12 68) P(x) = x7 + 6x6 + 5x5 + 30x4 + 4x3 + 24x2 69) P(x) = 54x6 + 117x5 + 120x4 + 110x3 + 56x2 – 7x – 10 18 70) P(x) = 44x4 – 532x3 + 543x2 – 166x + 11 71) P(x) = 2x5 + 25x4 – 22x3 – 113x2 + 56x + 52 72) P(x) = 2x5 + 5x4 – 33x3 – 23x2 + 79x – 30 J) Usando el método de bisección, halla las raíces de los siguientes polinomios, en el intervalo indicado, de tal forma que el error cometido sea menor a 0,01. 73) 4x3 – 5x2 + 4x – 5 en [1, 2] 74) 50x3 + 89x2 – 278x + 378 en [3, 4] 75) x4 – 30x3 + 81 en [5, 6] 76) 10x3 – 17x2 – 9x + 39 en [–2, –1] 77) x4 – 2x2 – 3 en [–2, –1] 78) x3 + 3x + 6 en [–2, –1] 79) x3 – 4x + 5 en [–3, –2] 80) x4 – 4x2 – 5 en [2, 3] 81) x3 + 5x – 1 en [0, 1] 82) 4x4 – 39x3 – 10 83) x5 + x3 – 50x2 – 50 84) x4 – 4x3 – 2x2 – 6x – 3 en [–4, –3] en [3, 4] en [–1, 0] K) Encuentra las raíces de los siguientes polinomios usando el método de Newton, tomando como primera aproximación el punto indicado. El error cometido debe ser menor que 0,01. 85) – 6x6 + x5 – 4x2 – 2x + 8 si x1 = 1 86) x8 – 10x6 + 35x4 – 50x2 + 24 si x1 = – 1,8 87) x8 – x7 – 2x6 + 4x4 – 7x3 – 13x2 + 14x + 16 si x1 = 1 19 88) 4x6 + 4x5 – 15x4 – 4x2 – 4x + 15 si x1 = – 2 89) 8x6 – 8x5 + 72x4 – 71x3 – x2 + 9x – 9 si x1 = – 1 90) 2x5 – 25x4 + 80x3 – 110x2 + 70x – 17 si x1 = 9 91) x5 + 7x4 – 6x3 – 29x2 + 5x – 30 si x1 = – 2 92) x6 + 7x5 – 12x4 – 77x3 + 10x2 + 11 si x1 = – 3 93) 2x6 + 2x5 – 61x4 – 53x3 + 86x2 – 145x + 29 si x1 = 5 L) Encontrar en cada caso un polinomio con coeficientes enteros que satisfaga las condiciones dadas. 94) Grado 3; raíces r1 = 2, r2 = (3 + i) 95) Grado 3; raíces r1 = 3, r2 = (6 – i) 96) Grado 4; raíces r1 = i, r2 = (2 + 2 i) 97) Grado 4; raíces r1 = 1 11 i, r2 = ( 1 11 i ) 98) Grado 3; raíces r1 = – i, r2 = 7/3 99) Grado 3; raíces r1 = 3/5, r2 = 7 i 5 i, r2 = 5 i, r3 = i/6 100) Grado 4; raíces r1 = 101) Grado 6; raíces r1 = i, r2 = (1 + i), r3 = (2 + i) 102) Grado 5; raíces r1 = (6 – 3i), r2 = (i + 7), r3 = 12 M) Encontrar las raíces del polinomio utilizando la raíz dada, en cada caso. 103) x4 – x2 – 2 si r1 = i 104) x4 + 2x2 + 1 si r1 = – i 105) x4 – 6x3 + 15x2 – 18x + 10 si r1 = (1 + i) 106) x4 – 4x3 – 15x2 + 80x – 100 si r1 = (2 – i) 107) x4 – 2x3 – 2x2 + 12x – 24 si r1 = 1 3i 20 108) 8x4 – 49x3 + 87x2 – x – 105 si r1 = – 7/8 109) x4 + 2x2 – 1 si r1 = i 1 2 110) x4 – 2x3 + 24x2 – 50x – 25 si r1 = 5i N) Encuentra las raíces del polinomio 111) x3 – 1 112) x3 + 6x – 7 113) x3 + 2x + 3 114) 4x4 + 4x3 + x2 – 18x – 9 115) 9x3 – 5x2 + 27x – 15 116) 5x3 + x2 + 40x + 8 117) 36x3 – 32x2 + 257x + 29 118) 3x3 + 7x2 + 80x + 26 119) 4x3 + 9x2 + 10x + 2 120) 3x3 + x2 + 3x + 1 121) 122) 2x3 – 7x2 + 30x + 17 x5 – x3 – x2 + 1 123) x3 – 2x2 + 1 124) x4 + x2 – 2 125) x5 – 2x4 + 8x3 – 16x2 – 9x + 18 126) 3x5 + x4 + 72x3 + 24x2 – 75x – 25 127) 128) 129) 130) 131) x7 – x6 – x5 – x4 – x3 – x2 – x – 1 en [ – 1, – 1 ] 21 PORTAPAPELES UTILES P(x) = x7 – x6 – x5 – x4 – x3 – x2 – x – 1; A = – 1, B=–1 P( x) 2x 4 3x 3 7 x 2 12x 4 Bibliografía: Oteyza de Oteyza, Emma Lam Osnaya. Hernández Garciadiego, Carlos. Carrillo Hoyo, Ängel Manuel. Temas Selectos de Matemáticas. Prentice Hall. México 1998. Bernis, Francisco. Malet, Antonio. Molinas, Cesar. Curso de Orientación Universitaria Matemáticas. Editorial Noguer. Madrid – España. 1983. Método de Newton De Wikipedia, la enciclopedia libre El método de Newton, conocido también como el método de Newton-Raphson o el método de Newton-Fourier es un algoritmo eficiente para encontrar aproximaciones de los ceros o raíces de una función real. También puede ser usado para encontrar el máximo o mínimo de una función, encontrando los ceros de su primera derivada. Tabla de contenidos [ocultar] 1 Descripción del método 2 Obtención del Algoritmo 3 Convergencia del Método 4 Ejemplo 5 Historia 6 Referencias 7 Enlaces externos Descripción del método 22 La idea de este método es la siguiente: se comienza con un valor razonablemente cercano al cero, denominado punto de arranque, entonces se reemplaza la función por la recta tangente en ese valor, se iguala a cero y se despeja fácilmente, por ser una ecuación lineal. Este cero será, generalmente, una aproximación mejor a la raíz de la función. Luego, se aplican tantas iteraciones como se deseen. Supóngase 𝑓: [𝑎, 𝑏] → ℝ función derivable definida en el intervalo real [a, b]. Se inicia con un valor inicial x0 y se define para cada número natural 𝑘 𝑥𝑘+1 = 𝑥𝑘 − 𝑓(𝑥𝑘 ) 𝑓 ′ (𝑥𝑘 ) Obtención del Algoritmo Tres son las formas principales por las que tradicionalmente se ha obtenido el algoritmo de Newton. La primera de ellas es una simple interpretación geométrica. En efecto, atendiendo al desarrollo geométrico del método de la secante, podría pensarse en que si los puntos de iteración están lo suficientemente cerca (a una distancia infinitesimal), entonces la secante se sustituye por la tangente a la curva en el punto. Así pues, si por un punto de iteración trazamos la tangente a la curva, por extensión con el método de la secante, el nuevo punto de iteración se tomará como la abscisa en el origen de la tangente (punto de corte de la tangente con el eje X). Esto es equivalente a linealizar la función, es decir, f se reemplaza por una recta tal que contiene al punto (x0, f (x0)) y cuya pendiente coincide con la derivada de la función en el punto, f'(x0). La nueva aproximación a la raíz, x1, se logra la intersección de la función linear con el eje X de ordenadas. Matemáticamente: 23 Ilustración de una iteración del método de Newton (la función f se demuestra en azul y la línea de la tangente está en rojo). Vemos que xn + 1 es una aproximación mejor que xn para la raíz x de la función f. En la ilustración adjunta del método de Newton se puede ver que xn + 1 es una mejor aproximación que xn para el cero (x) de la función f. Una forma alternativa de obtener el algoritmo es desarrollando la función f(x) en serie de Taylor, para un entorno del punto xn: Entonces, si se trunca el desarrollo a partir del término de grado 2, y evaluamos en xn + 1: f(xn + 1) = f(xn) + f'(xn)(xn + 1 − xn) Si además se acepta que xn + 1 tiende a la raíz, se ha de cumplir que f(xn + 1) = 0, luego, sustituyendo en la expresión anterior, obtenemos el algoritmo. Finalmente, hay que indicar que el método de Newton-Raphson puede interpretarse como un método de iteración de punto fijo. Así, dada la ecuación f(x) = 0, se puede considerar el siguiente método de iteración de punto fijo: g(x) = x + h(x)f(x) Se escoge h(x) de manera que g'(r)=0 (r es la raíz buscada). Dado que g'(r) es: g'(r) = 1 + h'(r)f(r) + h(r)f'(r) = 1 + h(r)f'(r) Entonces: 24 Como h8x) no tiene que ser única, se escoge de la forma más sencilla: Por tanto, imponiendo subíndices: Expresión que coincide con la del algoritmo de Newton-Raphson Convergencia del Método El radio de convergencia de este método es, por lo menos, cuadrático. Sin embargo, si la raíz buscada es de multiplicidad algebraica mayor a uno (i.e, una raíz doble, triple,...), el método de Newton-Raphson pierde su convergencia cuadrática y pasa a ser lineal de constante asintótica de convergencia 1-1/m, con m la multiplicidad de la raíz. Existen numerosas formas de evitar este problema, como pudieran ser los métodos de aceleración de la convergencia tipo Δ² de Aitken o el método de Steffensen. Derivados de Newton-Raphson destacan el método de Ralsta-Ravinovitz, que restaura la convergencia cuadrática sin más que modificar el algoritmo a: Evidentemente, este método exige conocer de antemano la multiplicidad de la raíz, lo cual no siempre es posible. Por ello también se puede modificar el algoritmo tomando una función auxiliar g(x)=f(x)/f'(x), resultando: Su principal inconveniente en este caso sería lo costoso que pudiera ser hallar g(x) y g'(x) si f(x) no es fácilmente derivable. Por otro lado, la convergencia del método se demuestra cuadrática para el caso más habitual en base a tratar el método como uno de punto fijo: si g'(r)=0, y g(r) es distinto de 0, entonces la convergencia es cuadrática. Sin embargo, está sujeto a las particularidades de éstos métodos. 25 Ejemplo Consideremos el problema de encontrar un número positivo x tal que cos(x) = x3. Podríamos tratar de encontrar el cero de f(x) = cos(x) - x3. Sabemos que f '(x) = -sin(x) - 3x2. Ya que cos(x) ≤ 1 para todo x y x3 > 1 para x>1, deducimos que nuestro cero está entre 0 y 1. Comenzaremos probando con el valor inicial x0 = 0.5 Los dígitos correctos están subrayados. En particular, x6 es correcto para el número de decimales pedidos. Podemos ver que el número de dígitos correctos después de la coma se incrementa desde 2 (para x3) a 5 y 10, ilustando la convergencia cuadrática. En pseudocódigo, esto es: function newtonIterationFunction(x) { return x - (cos(x) - x^3) / (-sin(x) - 3*x^2) } var x := 0.5 for i from 0 to 99 { print "Iteraciones: " + i print "Valor aproximado: " + x xold := x x := newtonIterationFunction(x) if x = xold { print "Solución encontrada!" break } } Historia [editar] El método de Newton fue descrito por Isaac Newton en De analysi per aequationes numero terminorum infinitas (escrito en 1669, publicado en 1711 por William Jones) y en De metodis fluxionum et serierum infinitarum (escrito en 1671, traducido y publicado como Método de fluxiones en 1736 por John Colson). Sin embargo, su descripción difiere en forma sustancial de la descripción moderna presentada más arriba: Newton aplica el método solo a polinomios. Él no computa las aproximaciones sucesivas xn, 26 sino que computa una secuencia de polinomios y recién al final llega a la aproximación de la raíz x. Finalmente, Newton ve el método como puramente algebraico y falla al no ver la conexión con el cálculo. Isaac Newton probablemente deriva su método de forma similar aunque menos precisa del método de François Viète. La esencia del método de Viète puede encontrarse en el trabajo del matemático persa Sharaf al-Din al-Tusi. Referencias [editar] Tjalling J. Ypma, Historical development of the Newton-Raphson method, SIAM Review 37 (4), 531–551, 1995. P. Deuflhard, Newton Methods for Nonlinear Problems. Affine Invariance and Adaptive Algorithms. Springer Series in Computational Mathematics, Vol. 35. Springer, Berlin, 2004. ISBN 3-540-21099-7. C. T. Kelley, Solving Nonlinear Equations with Newton's Method, no 1 in Fundamentals of Algorithms, SIAM, 2003. ISBN 0-89871-546-6. J. M. Ortega, W. C. Rheinboldt, Iterative Solution of Nonlinear Equations in Several Variables. Classics in Applied Mathematics, SIAM, 2000. ISBN 089871-461-3. W. H. Press, B. P. Flannery, S. A. Teukolsky, W. T. Vetterling, Numerical Recipes in C: The Art of Scientific Computing, Cambridge University Press, 1992. ISBN 0-521-43108-5. (online, with code samples: [1]) W. H. Press, B. P. Flannery, S. A. Teukolsky, W. T. Vetterling, Numerical Recipes in Fortran, Cambridge University Press, 1992. ISBN 0-521-43064-X (online, with code samples: [2]) Endre Süli and David Mayers, An Introduction to Numerical Analysis, Cambridge University Press, 2003. ISBN 0-521-00794-1. no mames brandon deja de mamarme el ganso! ahh pinche brandon.. le dire a los demas de fcfm... tmb es jotiiio el cepi Enlaces externos [editar] Método de Newton aplicado al cálculo de la raíz cuadrada de un número El método de Newton en Mathcad Application Server (con animación) Método de Newton-Raphson: Notas, PPT, Mathcad, Maple, Matlab, Mathematica Obtenido de "http://es.wikipedia.org/wiki/Método_de_Newton" Categorías: Wikipedia:Artículos buenos en w:de | Análisis numérico Presentación Bajo el nombre de Cálculo Numérico, Análisis Numérico, o Métodos Numéricos (las tres expresiones serán tomadas como sinónimos) se engloba el conjunto de 27 técnicas que sirven para resolver, mediante el uso de cálculos mecánicos (o algoritmos), problemas matemáticos bien determinados. Cabe aclarar que en el Cálculo Numérico no sólo interesa saber que existe una solución para un problema, sino que se buscan métodos para resolver los problemas de manera efectiva y concreta, aunque en general la solución que se obtiene sea aproximada. Normalmente se considera “Cálculo Numérico” como sinónimo de “Cálculo mediante computadoras” y, en efecto, en la práctica los cálculos mecánicos de los que hablábamos en el párrafo anterior suelen ser realizados por una computadora. Sin embargo, es interesante observar que la mayoría de los métodos numéricos que se estudian en los libros de texto han sido creados siglos antes que las computadoras, por lo que la computadora debe ser considerado un elemento accesorio y no esencial en este tema. La filosofía general de este curso será, en la medida de lo posible, motivar los temas que se traten mediante la introducción previa de problemas concretos. Así por ejemplo, los libros de texto de Cálculo Numérico suelen comenzar explicando “la aritmética de la máquina”, es decir, la forma en que las computadoras operan y guardan en la memoria números reales. En este curso, en cambio, trataremos ese tema cuando su necesidad haya sido convenientemente introducida. Cada clase cierra con ejercicios y problemas. Los ejercicios sirven para practicar o profundizar los temas estudiados en la clase de marras o en clases anteriores. Para resolver los problemas, en cambio, no basta con los conocimientos estudiados hasta ese momento. Los problemas implican un desafío mayor y tienen como objetivo introducir o motivar temas que se verán después en el curso. Se recomienda a los alumnos la resolución de estos ejercicios y problemas antes de seguir adelante. Problema 1.1: Imagine que tiene una calculadora que sólo permite sumar restar multiplicar y dividir ¿cómo podría usarla para hallar una aproximación, con dos cifras decimales exactas, de la raíz cuadrada de 28? (Use los métodos que sea capaz de imaginar, no consulte por ahora libros ni las otras clases de este curso, utilice su ingenio.) 28 Problema 1.2: En el dibujo, el ángulo alfa es tal que el área pintada de amarillo representa la cuarta parte del área total del círculo. a) Halle alguna ecuación de la cual alfa sea solución. b) Halle una solución aproximada de esa ecuación. (Como antes, use los métodos que sea capaz de imaginar, no consulte por ahora libros ni las otras clases de este curso, utilice su ingenio.) Problema 1.3: Enumere todos los métodos que conoce para calcular las raíces de un polinomio (por ejemplo, el método de Gauss). Aplique esos métodos para hallar todas las raíces de los siguientes polinomios: a) f(x) = x^5 + x^2 + 6 b) f(x) = x^4 – 7x^3 + 1 (A la clase 2) POSTED BY GUSTAVO PIÑEIRO AT 4:21 PM Clase 2 (A la clase 1 - A la clase 3) Método de la bisección En esta clase comenzaremos a estudiar distintos métodos para hallar soluciones aproximadas de ecuaciones con una incógnita, especialmente aquellas ecuaciones que sean difíciles de despejar. Todos los métodos que veremos tienen en común la siguiente característica: se comienza con una primera aproximación a la solución, digamos c1, a partir de ella se calcula una segunda aproximación c2 y así sucesivamente. Diremos que el método en cuestión converge si la sucesión numérica c1, c2, c3,... tiene como límite una solución exacta de la ecuación. 29 El método que veremos en esta clase se basa en el siguiente teorema del Cálculo: Teorema de Bolzano: Si f : [a,b] -> R es una función continua tal que f(a) y f(b) tienen distinto signo entonces existe algún c en (a,b) tal que f(c) = 0. Supongamos entonces que queremos resolver una ecuación de la forma f(x) = 0, donde f es una función continua en algún intervalo [a,b] y supongamos además que f(a) y f(b) tienen distinto signo. Bajo estas condiciones, el teorema anterior nos asegura que en (a,b) hay, al menos, una solución de la ecuación, llamémosla c. Sea, a modo de ejemplo, la ecuación x^3 + 2x - 1 = 0 (en todos los casos, el símbolo ^ significa "elevado a"), donde f(x) = x^3 + 2x - 1, que es continua en todo R. Para comenzar necesitamos dos números a y b tales que f(a) y f(b) tengan distinto signo. No existe un método estándar para hallar estos a y b, en nuestro ejemplo tras un rápido tanteo obtenemos que f(0) = -1 y que f(1) = 2. Primera aproximación: sabemos entonces que hay una raíz entre 0 y 1, como primera aproximación a esa solución tomamos el punto medio del intervalo [0,1], c1 = 0,5. No sabemos cuál es la solución exacta c, pero es seguro que su distancia a c1 no puede ser mayor a la mitad de la longitud del intervalo. En el caso general, la primera aproximación a la solución será el punto medio del intervalo [a,b], c1 = (a + b)/2. La distancia entre c1 y el valor exacto de c (el error de la aproximación) no puede ser mayor a la semilongitud de [a,b]: Segunda aproximación: Sigamos con nuestro ejemplo, el intervalo [0,1] ha quedado dividido en dos partes [0; 0,5] y [0,5; 1]. De ambas, debemos elegir aquella mitad en la que se sigan cumpliendo las condiciones del Teorema de Bolzano. Calculamos f(0,5) = 0,25, como f(0) y f(0,5) tienen distinto signo, nos quedamos con [0; 0,25], donde es seguro que existe una solución. La siguiente 30 aproximación es el punto medio de ese intervalo: c2 = 0,125. En el caso general, tras el primer paso, el intervalo [a,b] habrá quedado partido en dos mitades: [a, c1] y [c1, b]. Calculamos f(c1) y nos quedamos con el semiintervalo en el que f cambia de signo. El error en esta aproximación no puede ser mayor a (b - a)/4 ¿Por qué? Generalización: El procedimiento sigue de la misma forma. En cada paso tendremos un intevalo que cumple para f las condiciones de Bolzano (f tiene distinto signo en sus extremos). Tomamos como aproximación el punto medio de ese intervalo, el cual queda dividido en dos partes iguales. Calculamos f en ese punto medio y, según sea su signo, elegimos de los dos semiintervalos aquél que siga cumpliendo las condiciones de Bolzano. Y así sucesivamente. El error cometido en el paso n-ésimo, es decir, la diferencia entre el valor exacto c y la aproximación cn no puede ser mayor a (b - a)/2^n ¿Por qué? Y como (b a)/2^n tiende a 0, deducimos que cn converge a c. En otras palabras, a la larga nos iremos aproximando a una solución exacta de la ecuación. Resumen del método: 1) Buscamos un intervalo [a,b] tal que f(a) y f(b) tengan distinto signo. 2) Tomamos c1 = (a + b)/2. 3) Si f(a) y f(c1) tienen distinto signo, redefinimos b = c1. Si f(c1) y f(b) tienen distinto signo, redefinimos a = c1. 4) Tomamos c2 = (a + b)/2. 5) Si f(a) y f(c2) tienen distinto signo, redefinimos b = c2. Si f(c2) y f(b) tienen distinto signo, redefinimos a = c2. 6) Tomamos c3 = (a + b)/2. Y así sucesivamente. La diferencia entre cn y un número c tal que f(c) = 0 es menor que (b - a)/2^n, por lo que la sucesión c1, c2, c3,... convergerá a una solución de f(x) = 0. (Pueden verse ejemplos en los enlaces indicados más abajo.) 31 ¿Cuándo nos detenemos? Nos estamos preguntando por lo que se llama ténicamente el criterio de detención del algoritmo (1) En otras palabras ¿cuántas aproximaciones debemos calcular? Hay dos criterios posibles, uno de ellos prescribe detenerse cuando (b - a)/2^n es más pequeño que cierta cantidad establecida de antemano. La otra opción es que en cada paso se calcule el valor de f(cn) para detenerse en el momento en que el resultado obtenido sea, en valor absoluto, menor que cierta cantidad establecida de antemano. Por los motivos que veremos en la respuesta a la siguiente pregunta, esta cuestión no es en realidad muy importante. ¿Es útil este método? Una virtud que tiene este método (de la que carecen los otros que estudiaremos) es que siempre converge (una vez que se ha obtenido el intervalo [a,b] inicial). Una desventaja es que en general la convergencia es muy lenta, la bisección necesita, para obtener una buena aproximaxión, muchos más pasos que cualquiera de los otros métodos que veremos después. Pero estos métodos, para converger, necesitan que la primera aproximación que se toma, c1, esté cerca de la solución exacta de la ecuación. En consecuencia, el procedimiento usual es éste: se usan unos pocos pasos de la bisección para acercarse a c y a partir de allí se usa cualquiera de los otros métodos de convergencia rápida. Ejercicio 2.1: escriba cada una de estas ecuaciones en la forma f(x) = 0, halle un intevalo [a,b] que cumpla las condiciones del Teorema de Bolzano y calcule las aproximaciones c1, c2 y c3 del método de la bisección: a) x = exp(-x) (Donde exp(x) es la función exponencial e^x.) b) x = sen(x) c) x = tg(x), con x > 0. Problema 2.2: Sea la ecuación f(x) = 0, donde f es una función continua tal que f(a) es negativo y f(b) es positivo, para ciertos números a y b. Supongamos además que la ecuación tiene una única solución c en (a,b). Sea c1, c2, c3,... la sucesión que obtenemos por aplicación del método de la bisección ¿Es necesariamente cierto que la distancia entre cn y c disminuye a medida que n 32 crece? En otras palabras ¿es cierto que cada aproximación de c que obtenemos es mejor que la anterior? ¿Cómo justificaría su respuesta? Problema 2.3: a) Suponga que tiene una calculadora que sólo puede sumar, restar, multiplicar y dividir. ¿Cómo usaría el método de la bisección para calcular una aproximación de la raíz cuadrada de 28? b) Cuando decimos que c1, c2, c3,... converge a c ¿esto quiere decir que podemos calcular c con tanta exactitud como queramos? Usando la calculadora del punto anterior ¿puede calcular la raíz cuadrada de 28 con tanta precisión como quiera? Por ejemplo ¿puede aproximarla con 12.000 cifras decimales exactas? ¿Y si hace los cálculos con lápiz y papel? Enlaces en los que se habla de este tema: 1, 2, 3. Nota: (1) Un algoritmo es una receta mecánica para realizar un cálcul0 o cualquier otra operación (matemática o no). El método de la bisección describe un algoritmo. (A la clase 1 - A la clase 3) POSTED BY GUSTAVO PIÑEIRO AT 3:51 PM Clase 3 (A la clase 2 - A la clase 4) Introducción a la "aritmética de la máquina" La raíz cuadrada de 2 es 1,41421356237309504... donde los puntos suspensivos esconden una cantidad infinita de dígitos. Imaginemos dada una ecuación cuya solución sea la raíz de 2. Supongamos además que, usando el método de la bisección, calculamos sucesivas aproximaciones de esa solución: c1, c2, c3,... La teoría que vimos en la clase anterior dice que la sucesión c1, c2, c3,... converge a la raíz de 2, es decir, tomando n suficientemente grande cn se aproximará a la raíz de 2 tanto como queramos. Pero ¿es así en la práctica? 33 Normalmente haremos nuestros cálculos mediante el auxilio de una computadora (o una calculadora, que es también un tipo de computadora). No nos interesan aquí los detalles técnicos acerca de cómo una computadora almacena los números en su memoria (el lector interesado podrá encontrar esos detalles en los enlaces indicados más abajo). Sí nos interesa el siguiente hecho básico: cualquier computadora dispone de una cantidad finita y fija de memoria para almacenar los números con los que trabaja, así como de un espacio finito y fijo para mostrar esos números al usuario. No importa si los números almacenados son escritos usando punto fijo, punto flotante o cualquier otro método concebible, el hecho esencial es la limitación de memoria. Una consecuencia de este hecho básico es que cualquier computadorasólo es capaz de conocer una cantidad finita de números. Es decir, aunque en teoría hay una cantidad infinita de números reales, el conjunto de todos los números que una computadora es capaz de entender o mencionar es finito. Para poner un ejemplo, supongamos que la computadora almacenara los números de la siguiente forma: donde cada cuadrado es ocupado por un dígito entre 0 y 9, excepto el cuadrado que está a la izquierda de la coma, que no podrá contener un cero. El número 200 se almacenaría como +2,0000000 x 10^+02, el número 3 se almacenaría como +3,0000000 x 10^+00. El 0 se almacena aparte. La cantidad total de números que esta computadora puede comprender es 2 x 9 x 10^7 x (2 x 99 + 1) + 1 = 35.820.000.001 ¿Por qué? En particular, no importa cómo los números se almacenen, habrá un número, llamado el épsilon de la máquina, que será el menor número positivo que la computadora es capaz de almacenar. Cualquier número que ese épsilon será interpretado como igual a cero. En el ejemplo explicado más arriba el épsilon de la máquina es 10^(–99) ¿Por qué? La computadora no puede acercarse a 0 más que épsilon. El número más cercano a raíz de 2 que esta computadora es capaz de escribir es 1,4142136. Si usamos la computadora para calcular una sucesión c1, c2, c3,... 34 que, en teoría, se aproxime a raíz de 2 tanto como se quiera, en realidad se detendrá en 1,4142135 o 1,4142136 y allí se estabilizará, incapaz de acercarse más. Problema 3.1: ¿Cuánto es 10^99 + 10^(–99) – 10^99? ¿Cuánto es 10^99 – 10^99 + 10^(–99)? ¿Y si realiza los cálculos con una calculadora? Problema 3.2: En el algoritmo del método de la bisección, estudiado en la clase anterior, conviene definir cn = a + 0,5(b – a) en lugar de cn = (a + b)/2. Al hacerlo así se sigue la estrategia general de que, al efectuar cálculos numéricos es mejor calcular una cantidad añadiendo un pequeño término de corrección a una aproximación obtenida anteriormente. Le proponemos que halle un ejemplo tal que en su calculadora los resultados de calcular a + 0,5(b – a) y (a + b)/2 sean diferentes. Enlaces en los que se habla de este tema: 1, 2, 3, 4. (A la clase 2 - A la clase 4) POSTED BY GUSTAVO PIÑEIRO AT 4:44 PM Clase 4 (A la clase 3 - A la clase 5) 35 Punto fijo Es otro de los métodos de los métodos para hallar soluciones aproximadas de ecuaciones de una variable. Para ello necesitamos desarrollar previamente algunos conceptos. Definición: Sea 𝑔: ℝ ⟶ ℝ una función cualquiera, se dice que un número 𝑎 es punto fijo de 𝑔 si 𝑔(𝛼) = 𝛼 Por ejemplo si 𝑔(𝑥) = 2𝑥 2 − 6 entonces 2 es un punto fijo de 𝑔, pues 𝑔(2) = 2. Por definición, 𝛼 es un punto fijo de 𝑔 si y sólo si es solución de la ecuación 𝑔(𝑥) = 𝑥. Así por ejemplo, todos los puntos fijos de 𝑔(𝑥) = 2𝑥 2 − 6 resultan de resolver la ecuación 2𝑥 2 − 6 = 𝑥. Las dos soluciones de esta ecuación son 2 y − 1,5, que son exactamente los dos puntos fijos de 𝑔. Definición: A la ecuación 𝑔(𝑥) = 𝑥 se le llama ecuación de punto fijo de g. La ecuación 𝑔(𝑥) = 𝑥 es también la ecuación que permite hallar la intersección entre el gráfico de 𝑔(𝑥) y la recta 𝑦 = 𝑥. Gráficamente, los puntos fijos de 𝑔 corresponden a esos puntos de intersección: y 3 2 1 x -4 -3 -2 -1 1 -1 -2 -3 -4 -5 -6 2 3 36 El concepto de punto fijo se utiliza para hallar soluciones aproximadas de una ecuación de la forma 𝑓(𝑥) = 0. Para lograr esto, el primer paso será transformar la ecuación dada en otra equivalente que sea de la forma 𝑔(𝑥) = 𝑥. Por ejemplo, si la ecuación es 𝑥 3 + 2𝑥 − 1 = 0, entonces esto puede hacerse de distintas maneras: 𝑥= 1 − 𝑥3 , 2 𝑥 = 1 − 𝑥 − 𝑥3, 3 𝑥 = √1 − 2𝑥 = (1 − 2𝑥)1/3 Si tuviéramos un modo de hallar en forma aproximada un punto fijo de una función g entonces tendríamos un modo para hallar una solución de f(x) = 0. Pero ¿cómo puede hallarse un punto fijo de g, sin despejar la ecuación correspondiente? Estudiaremos la respuesta a esta pregunta en las próximas clases. Para hallar una solución aproximada por el metodo de punto fijo, es necesario transformar la ecuación en otra que sea de punto fijo, pudiendo lograrse esto de muchas maneras diferentes. Ejemplo: Se desea transformar la ecuación 𝑒 𝑥 + 𝑥 = 6, La transformación a punto fijo puede lograrse las siguientes formas: 𝑥 = 6 − 𝑒𝑥; 𝑥 = ln(6 − 𝑥) ; Por medio de ecuaciones equivalentes de la ecuación original se tiene la forma apropiada para hallar un punto fijo. En el primer caso de la función 𝑔(𝑥) = 6 − 𝑒 𝑥 y en el segundo, de la función ℎ(𝑥) = ln(6 − 𝑥) Definición: La sucesión 𝛼, 𝑔(𝛼), 𝑔2 (𝛼), 𝑔3 (𝛼), … se llama la órbita de 𝛼. Teorema: Si 𝑔(𝑥) es una función continua y la sucesión 𝛼, 𝑔(𝛼), 𝑔(𝑔(𝛼)), 𝑔(𝑔(𝑔(𝛼))), … es convergente entonces su límite es un punto fijo de 𝑔. 37 El teorema presenta una forma de hallar un punto fijo de 𝑔, basta realizar las iteraciones de la función partiendo de un número 𝛼, si la órbita es convergente las sucesivas iteraciones acercarán cada vez más a un punto fijo de 𝑔. Sin embargo, hay que tomar en cuenta que el teorema dice que si la órbita es convergente entonces su límite es un punto fijo de 𝑔. Se sabe que la órbita no siempre es convergente. Sea g: R -> R una función y sea a un número cualquiera. Apliquemos la función g al número a, luego apliquemos g al resultado, volvamos a aplicar g al nuevo resultado obtenido y así sucesivamente. A este proceso se le llama iterar la función g. Al iterar construimos la sucesión a, g(a), g(g(a)), g(g(g(a))),... que indicaremos como a, g(a), g2(a), g3(a),... Definición: La sucesión a, g(a), g2(a), g3(a),... se llama la órbita de a por g o, más brevemente, la órbita de a. Una manera clásica de visualizar las órbitas es la siguiente: 38 En el dibujo vemos el gráfico de una función g y la recta y = x (recuérdese que la intersección de ambos representa el punto fijo de g). Comenzamos con el punto a y nos movemos hacia la curva para visualizar (en el eje vertical) el valor de g(a). Para visualizar g(g(a)) debemos proyectar el valor g(a) hasta el eje x. El dibujo muestra cómo hacerlo usando la recta y = x como espejo. Desde g(a) (ahora en el eje x) vamos de nuevo hacia la curva y así obtenemos g(g(a)). En resumen, el movimiento es: comenzamos en a, vamos verticalmente hacia la curva, luego horizontalmente hacia la recta, verticalmente hacia la curva, horizontalmente hacia la recta, etc. Los puntos que quedan marcados sobre la curva van graficando la órbita de a. En el dibujo que acabamos de hacer, la órbita va convergiendo al punto fijo de g (es decir, los puntos de la órbita se van acercando cada vez más a la intersección de la recta y la curva). El siguiente teorema generaliza esta situación: Teorema: Si g(x) es una función continua y la sucesión a, g(a), g(g(a)), g(g(g(a))),... es convergente entonces su límite es un punto fijo de g. El teorema nos da entonces una forma de hallar un punto fijo de g, basta iterar la función partiendo de un número a, si la órbita es convergente las sucesivas iteraciones nos irán acercando cada vez más a un punto fijo de g. Sin embargo, hay que tomar en cuenta que el teorema dice que si la órbita es convergente entonces su límite es un punto fijo de g. Pero ¿la órbita es siempre convergente? Consideremos a modo de ejemplo la función h(x) = ln(6 – x) [recuérdese que proviene de la ecuación x + exp(x) = 6] y calculemos la órbita correspondiente a 39 a = 3: 3 1,098612289 1,589518371 1,483983896 1,507630212 1,502380355 1,503548289 1,503288577 1,503346335 1,503333490 1,503336347 1,503335711 1,503335853 1,503335821 1,503335828 1,503335827 1,503335827 1,503335827 1,503335827 La órbita se estabiliza en 1,503335827, que es (aproximadamente) el punto fijo de h y a la vez solución (aproximada) de la ecuación x + exp(x) = 6. [La inevitabilidad de trabajar con aproximaciones fue estudiada en la clase 3.] Consideremos ahora la función g(x) = 6 – exp(x). Nótese que los puntos fijos de g(x) y de h(x) = ln(6 – x) son los mismos pues en ambos casos son las soluciones de x + exp(x) = 6. Veamos la órbita de a = 1,5 con respecto a g(x) = 6 – exp(x): a = 1,5 1,518310930 1,435491095 1,798292060 –0,039323848 5,038560702 40 -148,2478466 6 -397,4287935 6 -397,4287935 6 A partir de este punto (si se hacen los cálculos con 10 dígitos) la órbita se estabiliza en el ciclo 6; -397,4287935; 6; -397,4287935; 6,... Si se trabaja con más decimales ese número 6 se ve así: 5,9999999999999999999999999999999999 999999999999999999999999999999999999 999999999999999999999999999999999999 999999999999999999999999999999999999 999999999999999999999999999999749465 212979943827764688882... Nótese que, aunque el valor de a estaba muy cerca del punto fijo, la órbita no convergió a él, sino que se alejó de él. En la próxima clase seguiremos estudiando el comportamiento de las órbitas, especialmente en relación con los puntos fijos. Problema 5.1: Tomemos una calculadora en modo DEG e iteremos la tecla COS. Al poco tiempo la máquina se estabilizará en el número 0,9998477415310881129598107686798... ¿Qué ecuación satisface este número? (Nótese que este número no es un punto fijo de la función cos(x) ¿por qué?) Ejercicio 5.2: Estudie el comportamiento de las órbitas de f(x) = 2x^2 – 1, para distintos valores de a. ¿Alguna de esas órbitas converge? Puede verse aquí un comentario, relacionado con esta clase, acerca de la teoría del caos. (A la clase 4 - A la clase 6) 41 POSTED BY GUSTAVO PIÑEIRO AT 11:13 PM Clase 6 (A la clase 5 - A la clase 7) Atractivos y repulsivos Consideremos la función g(x) = (1/9)*(x – 2)^2 – 2 (donde * indica la multiplicación y ^ es “elevado a”). Resolviendo la ecuación (1/9)*(x – 2)^2 = x llegamos a la conclusión de que g tiene dos puntos fijos: – 1 y 14. Recordemos que si una órbita cualquiera de g es convergente entonces convergerá a uno de estos dos números, pero ¿son convergentes todas las órbitas? Analicemos el comportamiento de algunas de ellas. Veamos primero la órbita que comienza con a = –0, 5: a = –0, 5 –1,305555556 –0,785922497 –1,137626205 –0,906144644 –1,061591479 –0,958517513 –1,027463792 –0,981606999 –1,012224412 –0,991833788 –1,005436732 –0,996372228 –1,002417052 –0,998387983 –1,001074389 –0,999283613 –1,000477534 –0,999681619 –1,000212243 El valor inicial está cerca de –1 y, en efecto, se ve que la órbita se va acercando a 42 ese número. ¿Qué sucede si tomamos valores iniciales cada vez más lejanos de – 1? Veamos distintos valores iniciales, que se vayan alejando de –1: a = –2 –0.222222222 –1.451303155 –0.676500726 –1.204038207 –0.859348797 –1.091569384 –0.938022083 –1.040891805 –0.972553003 –1.018214294 –0.987820275 –1.008103334 –0.994590481 –1.003603095 –0.997596494 –1.001601696 –0.998931918 –1.000711928 –0.999525325 También se va acercando a –1. Lo mismo sucederá si tomamos como valor inicial el número –3 0 el número –4. Alejémonos un poco más y tomemos a = – 11: a = –11 16,77777778 22,26474623 43,62888220 190,5515370 3948,186901 1,730263673 x 10^6 1,3326450507 x 10^12 43 1,229474775 x 10^22 La órbita diverge (su límite es infinito). Vemos entonces que si tomamos valores iniciales cercanos a –1 la órbita converge a ese número, pero si los valores iniciales se van alejando llegamos finalmente a una zona en la que los valores iniciales dan órbitas divergentes. ¿Qué sucede con el otro punto fijo? a = 13 11,44444444 7,910836752 1,881999012 –1,998452863 –0,223597189 –1,450623949 –0,677021596 –1,203728375 –0,859569389 –1,091429212 –0,938118381 –1,040828931 –0,972595490 –1,018186228 –0,987839099 –1,008090835 –0,994598837 –1,003597534 –0,997600206 La órbita comienza cerca de 14, pero ¡se acerca al otro punto fijo! Intentemos con a = 15: a = 15 16,77777778 22,26474623 43,62888220 190,5515370 44 3948,186901 1,730263673 x 10^6 3,326450507 x 10^11 1,229474775 x 10^22 La órbita diverge. En realidad, ninguna órbita converge a 14 no importa qué tan cerca de ese número comencemos. La única forma de que una órbita converja a 14 es que, por casualidad, caiga exactamente en ese número, por ejemplo: a = –10 14 14 14 Pero esta situación (el que una órbita caiga justo en el punto fijo) en la práctica será virtualmente imposible. Los ejemplos anteriores motivan las siguientes definiciones: Definición: Un punto fijo c de una función g(x) es atractivo si para cualquier valor inicial cercano a c la órbita correspondiente convergerá siempre a c. Con más precisión, un punto fijo c es atractivo si existe un número positivo delta tal que si la distancia entre a y c es menor que delta entonces la órbita de a converge a c. Definición: Un punto fijo c de una función g(x) es repulsivo si es imposible hallar una órbita que converja a él (a menos que, por coincidencia, caiga justamente en el número c). Con más precisión, un punto fijo c es repulsivo si existe un número positivo delta tal que si la distancia entre c y algún número r de la órbita es menor que delta entonces el valor siguiente de la órbita (que es g(r)) está más lejos de c que lo que estaba r (la órbita tiende a alejarse de c). Es claro que en el ejemplo anterior, en relación a los puntos fijos de g(x) = (1/9)*(x – 2)^2 – 2, el número –1 es un punto fijo atractivo, mientras que 14 es repulsivo. En la clase anterior proponíamos como método para hallar los puntos fijos de g 45 calcular una órbita cualquiera y confiar en que ésta vaya convergiendo, ya que necesariamente convergerá a un punto fijo. Vemos ahora que la órbita sólo convergerá (es decir el método sólo funcionará) si el punto fijo en cuestión es atractivo y si el valor inicial de la órbita está suficientemente cerca de él. ¿Cómo podemos saber, a priori, si un punto fijo es atractivo o repulsivo? Eso es lo que estudiaremos en la próxima clase. Problema 6.1: La función g(x) = 2x^2 –1 tiene dos puntos fijos, –1/2 y 1. Tome órbitas cercanas a cada uno de ellos y trate de determinar cuál de ambos (si es que hay alguno) que sea repulsivo y cuál de ambos (si es que hay alguno) que sea atractivo. ¿Qué sucede si toma a = –0,5? Problema 6.2: Analice el comportamiento de las órbitas de g(x) = ln(7 – cos x) que comienzan con números que están “lejos” de 2. (A la clase 5 - A la clase 7) POSTED BY GUSTAVO PIÑEIRO AT 11:57 AM Clase 7 (A la clase 6 - A la clase 8) Más sobre atractivos y repulsivos En la clase anterior estudiábamos la diferencia entre puntos fijos atractivos y puntos fijos repulsivos. Recordemos que si una órbita comienza cerca de un punto fijo atractivo entonces convergerá a él, mientras que es imposible encontrar una órbita que converja a un punto fijo repulsivo, no importa qué tan cerca de él comience. Por otra parte, a menos que la ecuación g(x) = x con la que estemos trabajando sea realmente muy sencilla (en cuyo caso no necesitaríamos métodos numéricos para resolverla), la única forma efectiva de hallar puntos fijos de g(x) es iterar la función confiando en que la órbita converja. Por lo tanto los únicos puntos fijos que seremos capaces de encontrar serán los puntos atractivos. La pregunta es ¿podemos saber a priori si un punto fijo es atractivo o repulsivo? El siguiente resultado nos dará buena parte de la respuesta. 46 Teorema: Sea g(x) una función derivable con derivada continua y sea c un punto fijo de g(x). Si g’(c) es menor que 1 entonces c es un punto fijo atractivo. Si g’(c) es mayor que 1 entonces c es un punto fijo repulsivo. Expliquemos la idea que está detrás del teorema. Sea c un punto fijo de g(x), desarrollemos el polinomio de Taylor de orden 1 de g(x) en x = c. Si x está cerca de c: g(x) # g(c) + g’(c)(x – c). (Donde # debe tomarse aquí como el signo de “aproximadamente igual”, es inevitable usar símbolos extraños, ya que el blog es avaro en símbolos matemáticos.) Como g(c) = c entonces: g(x) # c + g’(c)(x – c) g(x) – c # g’(c)(x – c) g(x) – c # g’(c)x – c (Recuérdese que si a y b son números reales entonces a – b es la distancia entre a y b.) Sea x0 el primer número de una órbita, que supondremos que está lo suficientemente cerca de c como para que valga la aproximación dada por el polinomio de Taylor. Notemos que g(x0) = x1, el siguiente valor de la órbita. Por lo tanto: x1 – c # g’(c)x0 – c Si g’(c) es menor que 1 entonces g’(c)x0 – c es menor que x0 – c, luego x1 – c es menor que x0 – c. Es decir, x1 está más cerca de c que lo que estaba x0. Aplicando el mismo razonamiento, x2 está más cerca que x1, x3 está más cerca que x2 y asís sucesivamente. De hecho puede probarse que la distancia entre xn y c tiende a cero. Es decir, para cualquier x0 suficientemente cerca de c sucede que la órbita converge a c. 47 Por lo tanto si g’(c) es menor que 1 entonces el punto fijo es atractivo. Por otra parte, si g’(c) > 1, un razonamiento similar anterior prueba que la distancia entre x1 y c es mayor que la distancia entre x0 y c, por lo que la órbita tiende a alejarse de c. Ejercicio 7.1: Halle (en forma aproximada, desde luego) todas las soluciones de la ecuación x^x = 0,7. Ejercicio 7.2: Halle en forma aproximada todas las raíces de los polinomios indicados. a) f(x) = x^5 + x^3 – 6x + 2 b) f(x) = x^3 + 2x – 7 Enlaces donde se tratan los temas estudiados en las clases 4 a 7: 1, 2, 3. (A la clase 6 - A la clase 8) POSTED BY GUSTAVO PIÑEIRO AT 9:09 AM Clase 8 (A la clase 7 - A la clase 9) El método de Newton El método de Newton (llamado en algunos textos método de Newton–Raphson) es otro de los métodos para resolver una ecuación de modo aproximado. Tal como sucede con los otros que hemos estudiado anteriormente, este método procede por aproximaciones sucesivas. Se comienza con un número x0 que se elige más o menos arbitrariamente, a partir de x0 se calcula un nuevo número x1; a partir de x1 se calcula un número x2 y así sucesivamente. Con suerte, los números x0, x1, x2,... se irán acercando cada vez más a una solución de la ecuación. La forma en que se calculas los sucesivos números x1, x2, x3,... se basa en una 48 idea gráfica muy sencilla y convincente. Sea f(x) = 0 la ecuación que queremos resolver y llamemos c a una solución de la ecuación. Tomemos como x0, la primera aproximación, cualquier número. Trazamos la recta tangente al gráfico de f en x0 (para que esto sea posible, suponemos que f es derivable en todo punto) y tomamos x1 como la raíz de esa recta tangente. A partir de aquí se repite el mismo procedimiento: trazamos la recta tangente al gráfico de f en x1 y tomamos x2 cmo la raíz de esta recta tangente, y así sucesivamente. Si tenemos suerte, x0, x1, x2,... convergerá a c, sin embargo, al menos en algunos casos, si x0 no es elegido de modo conveniente entonces puede suceder que la sucesión x0, x1, x2,... no converja. Un ejemplo de esta situación se da con la función f(x) = arctga(x) cuya única raíz es c = 0. Si x0 se elige suficientemente cerca de 0 entonces la sucesión x0, x1, x2,... converge a la raíz, pero si x0 es elegido lejos de 0, entonces la sucesión diverge: Como se ve en el gráfico, la sucesión x0, x1, x2,... se va alejando de c. 49 Las preguntas que surgen son: ¿si x0 se elige suficientemente cerca de c entonces la sucesión x1, x2, x3,... converge siempre a c? ¿Dado x0, cómo se calculan x1, x2, x3,...? Respondamos primero a la segunda pregunta. Recordemos que la ecuación de la recta tangente al gráfico de f en x = a es la siguiente: y = f(a) + f’(a)(x – a) Dado x0, calculamos la reca tangente al gráfico de f en x = x0: y = f(x0) + f’(x0)(x – x0) El número x1 es la raíz de la recta: 0 = f(x0) + f’(x0)(x1 – x0) Despejando: –f(x0) = f’(x0)(x1 – x0) –f(x0)/f’(x0) = x1 – x0 Entonces: x1 = x0 – f(x0)/f’(x0) Con el mismo razonamiento: x2 = x1 – f(x1)/f’(x1) x3 = x2 – f(x2)/f’(x2) Generalizando: x(n + 1) = xn – f(xn)/f’(xn) Por supuesto, estas fórmulas tienen sentido si f’(x0), f’(x1), f’(x2),... son todos distintos de cero. Suponemos entonces que f’ nunca se anula, al menos en las cercanías de c. 50 Observemos que el método de Newton es en realidad un caso particular del método del punto fijo, ya que x1, x2, x3,... se calculan a partir de x0 iterando la función: g(x) = x – f(x)/f’(x) Un ejemplo: aproximemos una raíz de f(x) = x^3 + x + 1. La fórmula que tenemos que iterar es g(x) = x – (x^3 + x + 1)/(3x^2 + 1). x – (x^3 + x + 1)/(3x^2 + 1) = (3x^3 + x – x^3 – x – 1)/(3x^2 + 1) = (2x^3 – 1)/(3x^2 + 1) Por otra parte, el teorema de Bolzano nos dice que hay una raíz entre –1 y 0. Elijamos entonces x0 = 0,5. Los valores que se obtienen son: –0,714285 –0,683179 –0,682328 –0,6823278 –0,6823278 La sucesión se estabiliza. Una raíz aproximada es –0,6823278. Para ver que la sucesión que se obtiene iterando g converge siempre a una raíz de f (si x0 se elige suficientemente de esa raíz) tenemos que probar que: 1) Un número c es punto fijo de g(x) = x – f(x)/f’(x) si y sólo si f(c) = 0. (Suponiendo que f’ no se anula en c.) 2) Todo punto fijo de g(x) = x – f(x)/f’(x) es atractivo. (Suponiendo también que f’ no se anula en ese punto fijo.) El punto 2) dice que la sucesión x0, x1, x2,... converge siempre a un punto fijo de g si x0 está suficientemente cerca de él y 1) dice que ese punto fijo es una raíz de f. Es decir, si x0 se elige convenientemente el método siempre converge a una raíz de f. Tenemos entonces el siguiente teorema. 51 Teorema: si x0 se elige suficientemente cerca de una raíz de f entonces y f’ no se anula en un entorno de esa raíz entonces el método de Newton converge a esa raíz de f. La demostración de los puntos 1) y 2) se deja como ejercicio para los lectores. Hay que observar (la demostración requiere un análisis más fino, que aquí no haremos) que el método de Newton no sólo converge, sino que además converge muy rápidamente. Ejercicio 8.1: Usando el método de Newton, halle en forma aproximada, todas las soluciones de la ecuación x^x = 0,7. Compare la velocidad de convergencia (es decir la cantidad de pasos necesaria para lograr una buena aproximación) con el método usado en el ejercicio 7.1. Ejercicio 8.2: Usando el método de Newton, halle en forma aproximada, todas las raíces de los polinomios indicados. a) f(x) = x^5 + x^3 – 6x + 2 b) f(x) = x^3 + 2x – 7 Compare la velocidad de convergencia (es decir la cantidad de pasos necesaria para lograr una buena aproximación) con el método usado en el ejercicio 7.1. Problema 8.3: Demuestre que un número c es punto fijo de g(x) = x – f(x)/f’(x) si y sólo si f(c) = 0. (Suponiendo que f’ no se anula en un entorno de c.) Ejercicio 8.4: Demuestre que todo punto fijo de g(x) = x – f(x)/f’(x) es atractivo. (Suponiendo también que f’ no se anula en ese punto fijo.) (A la clase 7 - A la clase 9) POSTED BY GUSTAVO PIÑEIRO AT 2:04 PM 52 Problema 4.1: Muestre un ejemplo de una función que no tenga ningún punto fijo. Problema 4.2: Demuestre que si f : R -> R es una función continua tal que f(0) es mayor que 0 y f(1) es menor que 1 entonces f tiene al menos un punto fijo en [0,1]. Problema 4.3: Tome una calculadora y marque en ella cualquier número positivo. Oprima reiteradamente la tecla “raíz cuadrada” ¿qué sucede a la larga? ¿Depende del número inicial elegido? ¿Cómo se relaciona su conclusión con lo estudiado en la clase anterior? Repita el problema con otras teclas de la calculadora. Ejercicio 4.4: Transforme cada una de las siguientes ecuaciones en al menos dos ecuaciones punto fijo diferentes. a) 3x^3 + 1 = 0 b) sen(x + 2) = 2 + x c) x^2 = tg(x) (A la clase 3 - A la clase 5) P O S T ED B Y G U S T A V O P I Ñ E I R O AT 9 : 2 8 PM (A la clase 4 - A la clase 6) Clase 5 Problemas Ejercicio 2.1: escriba cada una de estas ecuaciones en la forma f(x) = 0, halle un intevalo [a,b] que cumpla las condiciones del Teorema de Bolzano y calcule las aproximaciones c1, c2 y c3 del método de la bisección: 53 a) x = exp(-x) (Donde exp(x) es la función exponencial e^x.) b) x = sen(x) c) x = tg(x), con x > 0. Problema 2.2: Sea la ecuación f(x) = 0, donde f es una función continua tal que f(a) es negativo y f(b) es positivo, para ciertos números a y b. Supongamos además que la ecuación tiene una única solución c en (a,b). Sea c1, c2, c3,... la sucesión que obtenemos por aplicación del método de la bisección ¿Es necesariamente cierto que la distancia entre cn y c disminuye a medida que n crece? En otras palabras ¿es cierto que cada aproximación de c que obtenemos es mejor que la anterior? ¿Cómo justificaría su respuesta? Problema 2.3: a) Suponga que tiene una calculadora que sólo puede sumar, restar, multiplicar y dividir. ¿Cómo usaría el método de la bisección para calcular una aproximación de la raíz cuadrada de 28? b) Cuando decimos que c1, c2, c3,... converge a c ¿esto quiere decir que podemos calcular c con tanta exactitud como queramos? Usando la calculadora del punto anterior ¿puede calcular la raíz cuadrada de 28 con tanta precisión como quiera? Por ejemplo ¿puede aproximarla con 12.000 cifras decimales exactas? ¿Y si hace los cálculos con lápiz y papel?