UTN Facultad Regional Mendoza Cátedra Análisis de Señales y Sistemas El Problema de Sturm Liouville El problema de Sturm-Liouville establece un entorno de trabajo alrededor de una ecuación diferencial lineal de segundo orden con valores en la frontera, de la cual deriva una variedad de ecuaciones diferenciales muy atractivas como modelos matemáticos de interesantes problemas físicos y matemáticos, cuyas soluciones poseen propiedades de gran aplicación. Tal es el caso de las series de Fourier cuya importancia es capital dentro de las matemáticas y el análisis de señales, entre otras aplicaciones. Una forma general de la ecuación diferencial homogénea de segundo orden es: a(x) y” + b(x) y’ + [c(x) + λ d(x)] y = 0 Los coeficientes de esta ecuación son continuos en un cierto intervalo (a,b) y suponemos además que a(x) es ≠ 0 en dicho intervalo. Entonces podemos dividir por a(x) para re-escribir la ecuación diferencial como: (1) y” + R(x) y’ + [Q(x) + λ P(x)] y =0 Si ahora tomamos r(x) = e ∫ R(x) dx y multiplicamos por r(x) a la (1), se obtiene fácilmente: (2) (r(x) y’ )’ + [q(x) + λ p(x)] y = 0 (donde q = Q r y p = P r) La (2) es la ecuación diferencial de Sturm – Liouville. Supondremos que p(x), q(x), r(x) y r’(x) son continuas al menos en (a,b) y que p(x) y q(x) son positivas en dicho intervalo. Como quedó dicho, varias ecuaciones diferenciales de indudable importancia encajan en la forma general (2). Tales son las ecuaciones diferenciales de Bessel, Hermite, Laguerre, Legèndre, Jacobi y la del oscilador armónico entre otras. Veremos tres alternativas: a)El Problema de Sturm Liouville Regular (r(x) y’ )’ + [q(x) + λ p(x)] y = 0 con condiciones regulares en la frontera: A1 y(a) + A2 y’(a) = 0; B1 y(b) + B2 y’ (b)= 0; A1 y A2 no ambas nulas B1 y B2 no ambas nulas. b)El problema periódico de Sturm Liouville. r(a) = r(b); y(a) = y(b) ; y´(a) = y´(b) c)El Problema singular de Sturm Liouville Clase 1: r(a) = 0 y no hay condiciones para y(a) mientras que en b: B1 y(b) + B2 y’ (b)= 0; B1 y B2 no ambas nulas. Clase 2 : r(b) =0 y no hay condiciones para y(b), mientras que en a: A1 y(a) + A2 y’(a) = 0; A1 y A2 no ambas nulas. Clase 3: r(a) = r(b) = 0 y no hay condiciones y(a) ni y(b). Deseamos soluciones acotadas en [a,b]. Cada uno de estos problemas es un problema con valor en la frontera en el que se especifican ciertas condiciones en los extremos de un intervalo, en contraste con los problemas con valor inicial donde se establecen valores de y, de y’, etc., en un punto. El número λ que se busca es el que arroja soluciones no triviales. Cada función solución asociada con cada λ (valor propio o autovalor) es una función propia o autofunción. Los problemas con valores en la frontera usualmente no tienen soluciones únicas. Esto puede extrapolarse para resolver muchos problemas importantes, como veremos. En general, los valores propios tienen significado físico: por ejemplo, en la ecuación de onda son las frecuencias naturales de resonancia o modos fundamentales de vibración del sistema. Veamos por ejemplo un problema periódico de Sturm Liouville. y” + λ y =0 y(L) = y(-L); y´(L) = y´(-L). El intervalo en cuestión aquí es (-L, L). Comparando esto con la (2) vemos que: r(x) = 1 pues R(x) = 0; así r(x) = e ∫ R(x) dx = 1. De modo que r(-L) = r(L). a)Considere λ = 0. ⇒ y” =0 ⇒ y = C x + d y(-L) = y(L)= -CL + d = CL +d ⇒ 2 CL =0 ⇒ C=0 y = d constante. Luego, λ = 0 es un valor propio para una solución y=ctte ≠ 0 La solución no es trivial, pero es cuasi trivial pues un fenómeno constante es periódico, aunque el período está indefinido (puede ser cualquiera). b) Sea ahora λ = -k2 (λ negativo). y” - k2 y =0 ⇒ λ = ± k ⇒ y = C1 e kx + C2 e –kx Aplicando las condiciones de frontera, (3) y(L) = C1 e kL + C2 e –kL = y(-L) = C1 e–kL + C2 e kL ⇒ C1 = C2 Aplicando la segunda condición de borde: y´(L) = k C1 e ⇒ C1 (e kL kL -e -k C2 e –kL –kL = y´(-L) = kC1 e –kL -kC2 e kL ) = C1 (e –kL - e kL) ⇒ C1 = - C1 = 0 y C2 = 0 Luego, λ < 0 implica una solución trivial. c) Sea ahora λ > 0; λ = k2 y” + k2 y = 0. La solución de ésta es: y(x) = C1 cos kx + C2 sen kx Aplicando ahora la condición y(L) = y(-L), y(L) = C1 cos kL + C2 sen kL = C1 cos kL - C2 sen kL Esto implica que : C2 sen kL = 0 Vamos a suponer que sen kL ≠ 0. Esto conducirá a una solución trivial. En efecto: Si sen kL ≠ 0 entonces C2 = 0 Al imponer la segunda condición de borde (siempre con sen kL ≠ 0) se ve que y´(L) = y´(-L) = -k C1 sen kL + kC2 cos kL = kC1 sen kL + kC2 cos kL Entonces kC1 sen kL = 0. Es decir que C1 = 0 Por lo tanto sen kL debe ser = 0. ⇒ kL = n π 2 O sea, k = nπ /L, vale decir : λ = (nπ /L) Así entonces: yn(x) = C1 cos (nπ x / L) + C2 sen (nπ x / L) Con C1 y C2 no ambas nulas. Observe que con n=0 nos da el caso a): y0(x) = C1 2 Con n= 0, 1, 2, 3, ... obtenemos las funciones propias para λ = (nπ /L) El Teorema de Sturm Liouville 1- “Cada problema regular y cada problema periódico de Sturm Liouville tiene un número infinito real de valores propios distintos”. Si ordenamos de menor a mayor los valores propios se tiene: λn < λn+1; es decir lím λn = ∞ n→ ∞ 2- Si λn y λm son valores propios distintos en cualquiera de los tres problemas de Sturm Liouville definidos en (a,b) y ϕn(x) y ϕm(x) son las funciones propias correspondientes, entonces: b a p(x) ϕn(x) ϕm(x) dx = 0 si m ≠ n [Esto es ϕn(x) y ϕm(x) son ortogonales en (a,b) respecto de la función de peso p(x), cosa que veremos luego con mayor detalle.] 3- “Todos los valores propios son números reales”. 4- “Para un problema regular de Sturm Liouville, dos funciones propias de un mismo valor propio son linealmente dependientes: una es múltiplo constante de la otra”. Definición: Sea p(x) continua en [a,b] y p(x) >0 en (a,b). 1.Sean f(x) y g(x) integrables en [a,b], definimos el producto interno o producto “punto” respecto de p(x) como: b f .g= p(x) f(x) g(x) dx . a 2.Si f y g son ortogonales en [a,b] respecto de p(x) entonces b f .g= p(x) f(x) g(x) dx =0 a Ortogonalidad, (prueba de 2). Sea (r(x) ϕn’ )’ + [q(x) + λn p(x)] ϕn = 0 (r(x) ϕm’ )’ + [q(x) + λm p(x)] ϕm = 0 y Multipliquemos la primera por ϕm(x) y la segunda por ϕn(x) y restemos. (4) (r(x) ϕn’)’ ϕm - (r(x) ϕm’)’ ϕn = (λ λm - λn) p(x) ϕnϕm λm ≠ λn b b [(r(x) ϕn’)’ ϕm - (r(x) ϕm’)’ ϕn ] dx = (λm - λn) p(x) ϕnϕm dx (5) a a Si probamos que el primer miembro de (5) es cero, se habrá demostrado la ortogonalidad. Integrando por partes el primer miembro nos da: b b r(x) ϕn’ ϕm a b r(x) ϕn’ ϕ’m dx - r(x) ϕm’ ϕn a b + r(x) ϕn’ ϕ’m dx = a a = r(b)ϕn’(b)ϕm(b) - r(a) ϕn’(a)ϕm(a) - r(b) ϕm’(b)ϕn(b) + r(a)ϕm’(a) ϕn(a) Agrupando, (6) = r(b)[ϕn’(b)ϕm(b) - ϕm’(b)ϕn(b)] - r(a) [ϕn’(a)ϕm(a) - ϕm’(a) ϕn(a)]. Aplicando las condiciones de frontera en a: A1 ϕn(a) + A2 ϕ’n(a) =0 A1 ϕm(a) + A2 ϕ’m(a) =0 Las constantes A1 y A2 son determinables si el determinante principal del sistema homogéneo es nulo. ϕn(a) ϕ’n (a) ϕm(a) ϕ’m (a) = 0 ⇒ ϕn(a) ϕ’m (a) - ϕm(a) ϕ’n (a) = 0 Así, el segundo corchete de (6) es nulo. Del mismo modo se comprueba que el primer corchete es nulo, aplicando las condiciones de frontera en b. Como el primer miembro de (5) es nulo y λm - λn ≠ 0 se llega a: b p(x) ϕn(x) ϕm(x) dx = 0 si m ≠ n a Si m = n, b 2 p(x) ϕn (x) dx ≠ 0 a menos que ϕn = 0 (trivial). a Ésta es la norma cuadrado de ϕn respecto de p(x). * “Los λn son reales”. Supongamos que λn = α + iβ y ϕn (x) = u(x) + i v(x) ϕn* (x) = u(x) – iv(x) ϕ’n (x) = u’(x) + i v’(x) ϕ’n* (x) = u’(x) – iv’(x) Análogamente para λ*n ϕn* pues p(x), q(x) y r(x) son reales. (r(x) ϕ*n’ )’ + [q(x) + λ*n p(x)] ϕ*n = 0 Esta surge de conjugar la E D de Sturm Liouville: significa que λ*n es valor propio asociado con la función propia ϕ*n. Entonces ϕn y ϕ*n pueden concebirse como dos funciones propias de valores propios distintos. Por lo tanto deberán ser ortogonales. b b ϕn ϕn* p(x) dx = 0. Esto significa que a ϕn a 2 p(x) dx = 0 Como p(x) > 0 Es decir que necesariamente debe cumplirse u2(x) + v2(x) = 0 ⇒ u(x) = v(x) = 0 Esto implica que ϕn(x) =0. Vale decir: la suposición de que el valor propio es complejo nos conduce a una situación trivial. En consecuencia, las soluciones con funciones propias no triviales corresponden a valores propios reales. λn = real. * “Dos funciones propias con el mismo λ son linealmente dependientes” Si observamos la (4) con λn = λm su segundo miembro es nulo. Así obtenemos: (r(x) ϕn’)’ ϕm - (r(x) ϕm’)’ ϕn =0. Si integramos por partes entre a y x / x ∈ (a,b) x x (r(t) ϕn’)’ ϕm dt - (r(t) ϕm’)’ ϕn dt =0 a a x r(t) ϕn’ ϕm x a x x r(t) ϕn’ ϕm’ dt – [r(t) ϕm’ϕn + a a r(t) ϕn’ ϕm’ dt = 0 a r(x) ϕn’(x) ϕm(x) - r(a) ϕn’(a) ϕm(a) - r(x) ϕm’(x) ϕn(x) + r(a) ϕn’(a) ϕm(a) = 0 Agrupando, r(x) [ϕn’(x) ϕm(x) - ϕm’(x) ϕn(x)] – r(a) [ϕn’(a) ϕm(a) - ϕn’(a) ϕm(a)] = 0 Pero el corchete evaluado en a es nulo como ya hemos visto. Además r(x) >0, Entonces ϕn’(x) ϕm(x) - ϕm’(x) ϕn(x) = 0 ϕm(x) O bien ϕn(x) W(x) = = 0 ⇒ ϕm(x) y ϕn(x) son linealmente ϕm’(x) ϕn’(x) dependientes. La Serie de Fourier como Problema Periódico de Sturm Liouville Sea Con y” + λ y =0 y(-L) = y(L) = 0; y(-L) = y(L) = 0 En este caso vimos que: λn = (n π/ L)2 y ahora los extremos a = -L; b = L yn(x) = An cos (n π x/ L) + Bn sen (n π x/ L). Por linealidad escribimos: ∞ y(x) = Σ An cos (n π x/ L) + Bn sen (n π x/ L) = n=0 Siendo 1, cos (π x/ L), sen (π x / L), cos (2π x/ L), sen (2π x / L), ... las aotofunciones. Aquí p(x) = 1. Entonces, multiplicando por cos (n π x/ L) o por sen (n π x/ L) e integrando entre –L y L se obtienen respectivamente: L Ao = 1/2L y(x) dx para n=0; -L L An = 1/L y(x) cos (n π x/ L) dx -L y L Bn = 1/L y(x) sen (n π x / L) dx, para n ≥ 1 -L Polinomios Ortogonales Una vez definido el producto interno entre dos funciones < f , g >, respecto a una función de peso como: a (7) < f , g > = f *(x) g(x) p(x) dx b ∞ sea ahora un conjunto de polinomios ortogonales {Pn (x)} n=0, donde Pn (x) es un polinomio de grado n. Dicho conjunto forma un sistema ortogonal de polinomios con la función de peso p(x) si: b Pn(x) Pm(x) p(x) dx = δmn Am a Donde δmn se la conoce como “delta de Krönecker” y vale 1 si m=n y 0 si m ≠ n, y Am = norma del polinomio Pm(x); (A m> 0). ∞ Teorema: sea el conjunto de polinomios ortogonales {Pn (x)} respecto de p(x). Sea Qk(x) un polinomio cualquiera entonces P n (x) es ortogonal a Qk(x). Demostración: k Qk(x) = Σav xv; v v tomemos x = Σ bu Pu(x), v =0 u=0 v con bu proporcionales a < x , Pu(x) >. n=0 en [a,b] con tal que k < n, Luego, k v Qk(x) = Σ av Σ bu Pu(x), v =0 u=0 k < Pn , Qk > = v Σ av Σ bu < Pn, Pu> v =0 =0 si n > k u=0 Teorema: “Los ceros de los polinomios ortogonales son reales y simples”. Sabemos que: b < Qk, Pn+1 > = Q*k Pn+1 p(x) dx =0 ∀ k<n a Supongamos ahora que Pn+1(x) no tiene raíces reales (no cruza el eje x). b Por lo tanto, si Qk (x) =1; 1 Pn+1 p(x) dx ≠ 0 a pero debe dar cero, en consecuencia tiene al menos una raíz real. Sea α esa raíz. Tomemos Qk (x) = (x - α ); Pn+1(x) = (x - α ) Sn(x). Luego, < Pn+1(x), (x - α) > = 0 b 2 Pero < Pn+1(x), (x - α) > = (x - α ) Sn(x) p(x) dx será distinto de cero si Sn(x) a no tiene raíz real. Así, como la integral debe dar cero, entonces se deduce que Sn(x) tiene al menos una raíz real. Y así sucesivamente. En definitiva Pn+1(x) tiene n+1 raíces reales. Todas estas raíces reales son, además, simples porque, del razonamiento anterior, se tiene que: Si m ≥ 2: m (x - α) Sn+1-m(x) = Pn+1(x). Sea Qk(x) = (x - α) Sn+1-m(x). (Analizamos el caso m = impar, dejando por analogía el caso de m = par). m ≥ 3. Note que: k = n+1 – m + 1 = n+1 – (m-1) < n+1 b Qk(x) Pn+1 p(x) dx = 0 a b m (x - α) Sn+1-m(x) (x - α) Sn+1-m(x) p(x) dx a b m+1 (x - α) 2 [Sn+1-m(x)] p(x) dx es distinto de cero pues m+1 es par y a 2 el [corchete] y p(x) son positivos. Pero debe dar cero!! porque k < m+1. ⇒ < Pn+1(x), Qk(x) > = 0 Esta contradicción a su vez implica que m no puede ser ≥ 2. Entonces las raíces son simples. Propiedades Fundamentales de los Polinomios Ortogonales Unicidad Dados el intervalo [a, b] y p(x) > 0, el conjunto de polinomios ortogonales {Pn(x)}; n = 0, 1, 2,... es único. b Es decir: Pn(x) Pm(x) p(x) dx a b = Qn(x) Qm(x) p(x) dx ⇒ Pn(x) = Qn(x). a ∀ n ∈ No (Se trata de un problema de Sturm Liouville: dada una misma p(x) debe haber una misma solución). Recurrencia Los polinomios ortogonales están relacionados de tal modo que para tres “n” consecutivos Pk-1(x), Pk(x), Pk+1(x) tienen una vinculación algebraica sencilla. Probaremos que Pn+1(x) = (an x + bn) Pn(x) – cn Pn-1(x). Fijemos n y dejemos sin subíndices a an, bn y cn por sencillez. Entonces demostraremos que: Pn+1(x) = (ax+b) Pn(x) – c Pn-1(x). Si ajustamos a para que se cancelen los términos de grado n+1 a x Pn(x) - Pn+1(x) = Qn(x), polinomio de grado “n”. Si ajustamos ahora b para que se cancelen los términos resultantes de grado “n”, quedará un polinomio de grado n-1. En consecuencia: n-1 (8) (ax+b) Pn(x) - Pn+1(x) = Rn-1(x) = Σ λi Pi(x). i =0 (Pues todo polinomio Rn-1(x) puede expresarse como combinación lineal de los Pi(x) para i = 0, 1, 2,..., n-1). Elijamos j ≤ n-2 para hacer productos internos con Pj(x). n-1 < (ax+b) Pn(x), Pj(x) > - < Pn+1(x), Pj(x) > = Σ λi <Pi(x), Pj(x)> = i =0 = λj < Pj(x), Pj(x) > =λj Pj(x) 2 =0 Porque < Pn+1(x), Pj(x) > =0 < ax Pn(x), Pj(x) > = < a Pn(x), xPj(x) > = 0 porque j+1 < n < b Pn(x), Pj(x) > = 0 Entonces λj Pj(x) 2 = 0 implica que los λj deben ser nulos para todos los j ≤ n-2. Así, de la (8), λj = 0 para j = 0, 1, ..., n-2 En consecuencia, (ax+b) Pn(x) - Pn+1(x) = λn-1 Pn-1(x). Ahora hagamos c= λ n-1 y nos queda demostrada la relación de recurrencia. (9)Pn+1(x) = (ax+b) Pn(x) - c Pn-1(x) Forma General de la Ecuación Diferencial Lineal Homogénea de Segundo Orden Veremos que la expresión general de esta ecuación puede concebirse con la forma de Sturm Liouville (10)P(x) y” + Q(x) y’ + R(x) y = 0 Suponiendo que P(x) no se anula en (a, b), dividimos la (10) y nos queda: (11) y” + Q/P y’ + R/P y = 0. Hagamos r(x) = e ∫ Q/P dx r’(x) = Q/P e ∫ Q/P dx Multiplicando la (11) por r(x) obtenemos: y” r + Q/P. r y’ + R/P . r y = 0 y” r + r’ y’ + R/P . r y = 0 Que puede escribirse como (y’ r )’ + R/P . r y = 0 que es la forma de Sturm Liouville. Si hacemos finalmente R/P .r = λ ω(x) – q(x) ; (12) (y’ r)’ + (λ λ ω(x) – q(x)) y = 0 Por ejemplo, la ecuación diferencial de Bessel es: 2 2 2 2 x y” + x y’ + ( x λ - ν ) y = 0 2 2 (x y’)’ + ( x λ - ν / x) y = 0 . Ecuaciones Diferenciales que conducen a Polinomios Ortogonales Sea Q(x) un polinomio de grado ≤ 2 en x. Sea L(x) un polinomio lineal en x. La ecuación diferencial (13) Q(x) y” + L(x) y’ + λ y = 0 Si r(x) = e ∫ L/Q dx y W(x) = r / Q, las soluciones de la ecuación diferencial (13) son polinomios ortogonales. Dependiendo de la forma y grados de L(x) y Q(x) se obtienen las ecuaciones diferenciales de Legèndre, Hermite, Laguerre, Jacobi, etc. y los polinomios solución son los polinomios homónimos. La función W(x) es la función de peso para ortogonalidad en cada caso. Fórmula de Rodrigues Una famosa fórmula, cuya deducción es un tanto delicada para colocarla aquí, es la Fórmula de Rodrigues, la cual permite obtener en cada caso los polinomios antedichos. Ésta es: (14) Pn (x) = 1 / [en W(x)] { d n / dx n (W(x) [Q(x)]n) } . El coeficiente en depende de cada caso y figura en las tablas correspondientes (ver páginas siguientes). Preparó: Ing. Eduardo S. Serdoch Mendoza, Julio de 2006 Bibliografía Matemáticas Avanzadas para Ingeniería Quinta Edición Peter V. O’Neil Ed. Thomson. Matemáticas Avanzadas para Ingeniería Quinta Edición Vol I Erwin Kreyszig Ed. Limusa. Sitio Web Wikipedia: Orthogonal Polynomials; Sturm Liouville Theory, etc.