y” + b(x) y` +

Anuncio
UTN Facultad Regional Mendoza
Cátedra Análisis de Señales y Sistemas
El Problema de Sturm Liouville
El problema de Sturm-Liouville establece un entorno de trabajo alrededor de
una ecuación diferencial lineal de segundo orden con valores en la frontera, de
la cual deriva una variedad de ecuaciones diferenciales muy atractivas como
modelos matemáticos de interesantes problemas físicos y matemáticos, cuyas
soluciones poseen propiedades de gran aplicación. Tal es el caso de las series
de Fourier cuya importancia es capital dentro de las matemáticas y el análisis
de señales, entre otras aplicaciones.
Una forma general de la ecuación diferencial homogénea de segundo orden es:
a(x) y” + b(x) y’ + [c(x) + λ d(x)] y = 0
Los coeficientes de esta ecuación son continuos en un cierto intervalo (a,b) y
suponemos además que a(x) es ≠ 0 en dicho intervalo.
Entonces podemos dividir por a(x) para re-escribir la ecuación diferencial como:
(1)
y” + R(x) y’ + [Q(x) + λ P(x)] y =0
Si ahora tomamos r(x) = e
∫ R(x) dx
y multiplicamos por r(x) a la (1), se obtiene
fácilmente:
(2)
(r(x) y’ )’ + [q(x) + λ p(x)] y = 0
(donde q = Q r y p = P r)
La (2) es la ecuación diferencial de Sturm – Liouville.
Supondremos que p(x), q(x), r(x) y r’(x) son continuas al menos en (a,b) y que
p(x) y q(x) son positivas en dicho intervalo.
Como quedó dicho, varias ecuaciones diferenciales de indudable importancia
encajan en la forma general (2). Tales son las ecuaciones diferenciales de
Bessel, Hermite, Laguerre, Legèndre, Jacobi y la del oscilador armónico entre
otras.
Veremos tres alternativas:
a)El Problema de Sturm Liouville Regular
(r(x) y’ )’ + [q(x) + λ p(x)] y = 0 con condiciones regulares en la frontera:
A1 y(a) + A2 y’(a) = 0;
B1 y(b) + B2 y’ (b)= 0;
A1 y A2 no ambas nulas
B1 y B2 no ambas nulas.
b)El problema periódico de Sturm Liouville.
r(a) = r(b);
y(a) = y(b) ; y´(a) = y´(b)
c)El Problema singular de Sturm Liouville
Clase 1: r(a) = 0 y no hay condiciones para y(a) mientras que en b:
B1 y(b) + B2 y’ (b)= 0; B1 y B2 no ambas nulas.
Clase 2 : r(b) =0 y no hay condiciones para y(b), mientras que en a:
A1 y(a) + A2 y’(a) = 0; A1 y A2 no ambas nulas.
Clase 3: r(a) = r(b) = 0 y no hay condiciones y(a) ni y(b). Deseamos soluciones
acotadas en [a,b].
Cada uno de estos problemas es un problema con valor en la frontera en el que
se especifican ciertas condiciones en los extremos de un intervalo, en contraste
con los problemas con valor inicial donde se establecen valores de y, de y’,
etc., en un punto.
El número λ que se busca es el que arroja soluciones no triviales. Cada función
solución asociada con cada λ (valor propio o autovalor) es una función propia
o autofunción.
Los problemas con valores en la frontera usualmente no tienen soluciones
únicas. Esto puede extrapolarse para resolver muchos problemas importantes,
como veremos.
En general, los valores propios tienen significado físico: por ejemplo, en la
ecuación de onda son las frecuencias naturales de resonancia o modos
fundamentales de vibración del sistema.
Veamos por ejemplo un problema periódico de Sturm Liouville.
y” + λ y =0
y(L) = y(-L);
y´(L) = y´(-L).
El intervalo en cuestión aquí es (-L, L).
Comparando esto con la (2) vemos que:
r(x) = 1 pues R(x) = 0; así r(x) = e
∫ R(x) dx
= 1.
De modo que r(-L) = r(L).
a)Considere λ = 0. ⇒ y” =0 ⇒ y = C x + d
y(-L) = y(L)= -CL + d = CL +d ⇒ 2 CL =0 ⇒ C=0
y = d constante. Luego, λ = 0 es un valor propio para una solución y=ctte ≠ 0
La solución no es trivial, pero es cuasi trivial pues un fenómeno constante es
periódico, aunque el período está indefinido (puede ser cualquiera).
b) Sea ahora λ = -k2 (λ negativo).
y” - k2 y =0
⇒ λ = ± k ⇒ y = C1 e
kx
+ C2 e
–kx
Aplicando las condiciones de frontera,
(3)
y(L) = C1 e
kL
+ C2 e
–kL
= y(-L) = C1 e–kL + C2 e kL ⇒ C1 = C2
Aplicando la segunda condición de borde:
y´(L) = k C1 e
⇒ C1 (e
kL
kL
-e
-k C2 e
–kL
–kL
= y´(-L) = kC1 e –kL -kC2 e kL
) = C1 (e –kL - e kL) ⇒ C1 = - C1 = 0 y C2 = 0
Luego, λ < 0 implica una solución trivial.
c) Sea ahora λ > 0; λ = k2
y” + k2 y = 0. La solución de ésta es: y(x) = C1 cos kx + C2 sen kx
Aplicando ahora la condición y(L) = y(-L),
y(L) = C1 cos kL + C2 sen kL = C1 cos kL - C2 sen kL
Esto implica que :
C2 sen kL = 0
Vamos a suponer que
sen kL ≠ 0. Esto conducirá a una solución trivial. En
efecto:
Si sen kL ≠ 0 entonces C2 = 0
Al imponer la segunda condición de borde (siempre con sen kL ≠ 0) se ve que
y´(L) = y´(-L) = -k C1 sen kL + kC2 cos kL = kC1 sen kL + kC2 cos kL
Entonces kC1 sen kL = 0. Es decir que C1 = 0
Por lo tanto sen kL debe ser = 0.
⇒ kL = n π
2
O sea, k = nπ /L, vale decir : λ = (nπ /L)
Así entonces:
yn(x) = C1 cos (nπ x / L) + C2 sen (nπ x / L)
Con C1 y C2 no ambas nulas.
Observe que con n=0 nos da el caso a): y0(x) = C1
2
Con n= 0, 1, 2, 3, ... obtenemos las funciones propias para λ = (nπ /L)
El Teorema de Sturm Liouville
1- “Cada problema regular y cada problema periódico de Sturm Liouville tiene
un número infinito real de valores propios distintos”.
Si ordenamos de menor a mayor los valores propios se tiene:
λn < λn+1; es decir
lím λn = ∞
n→ ∞
2- Si λn y λm son valores propios distintos en cualquiera de los tres problemas
de Sturm Liouville definidos en (a,b) y ϕn(x) y ϕm(x) son las funciones propias
correspondientes, entonces:
b
a
p(x) ϕn(x) ϕm(x) dx = 0 si m ≠ n
[Esto es ϕn(x) y ϕm(x) son ortogonales en (a,b) respecto de la función de peso
p(x), cosa que veremos luego con mayor detalle.]
3- “Todos los valores propios son números reales”.
4- “Para un problema regular de Sturm Liouville, dos funciones propias de un
mismo valor propio son linealmente dependientes: una es múltiplo constante de
la otra”.
Definición: Sea p(x) continua en [a,b] y p(x) >0 en (a,b).
1.Sean f(x) y g(x) integrables en [a,b], definimos el producto interno o producto
“punto” respecto de p(x) como:
b
f
.g=
p(x) f(x) g(x) dx .
a
2.Si f y g son ortogonales en [a,b] respecto de p(x) entonces
b
f
.g=
p(x) f(x) g(x) dx =0
a
Ortogonalidad, (prueba de 2).
Sea
(r(x) ϕn’ )’ + [q(x) + λn p(x)] ϕn = 0
(r(x) ϕm’ )’ + [q(x) + λm p(x)] ϕm = 0
y
Multipliquemos la primera por ϕm(x) y la segunda por ϕn(x) y restemos.
(4)
(r(x) ϕn’)’ ϕm - (r(x) ϕm’)’ ϕn = (λ
λm - λn) p(x) ϕnϕm
λm ≠ λn
b
b
[(r(x) ϕn’)’ ϕm - (r(x) ϕm’)’ ϕn ] dx = (λm - λn) p(x) ϕnϕm dx
(5)
a
a
Si probamos que el primer miembro de (5) es cero, se habrá demostrado la
ortogonalidad.
Integrando por partes el primer miembro nos da:
b
b
r(x) ϕn’ ϕm a
b
r(x) ϕn’ ϕ’m dx - r(x) ϕm’ ϕn
a
b
+ r(x) ϕn’ ϕ’m dx =
a
a
= r(b)ϕn’(b)ϕm(b) - r(a) ϕn’(a)ϕm(a) - r(b) ϕm’(b)ϕn(b) + r(a)ϕm’(a) ϕn(a)
Agrupando,
(6)
= r(b)[ϕn’(b)ϕm(b) - ϕm’(b)ϕn(b)] - r(a) [ϕn’(a)ϕm(a) - ϕm’(a) ϕn(a)].
Aplicando las condiciones de frontera en a:
A1 ϕn(a) + A2 ϕ’n(a) =0
A1 ϕm(a) + A2 ϕ’m(a) =0
Las constantes A1 y A2 son determinables si el determinante principal del
sistema homogéneo es nulo.
ϕn(a)
ϕ’n (a)
ϕm(a)
ϕ’m (a)
= 0 ⇒ ϕn(a) ϕ’m (a) - ϕm(a) ϕ’n (a) = 0
Así, el segundo corchete de (6) es nulo. Del mismo modo se comprueba que el
primer corchete es nulo, aplicando las condiciones de frontera en b.
Como el primer miembro de (5) es nulo y λm - λn ≠ 0 se llega a:
b
p(x) ϕn(x) ϕm(x) dx = 0 si m ≠ n
a
Si m = n,
b
2
p(x) ϕn (x) dx ≠ 0 a menos que ϕn = 0 (trivial).
a
Ésta es la norma cuadrado de ϕn respecto de p(x).
*
“Los λn son reales”.
Supongamos que λn = α + iβ y
ϕn (x) = u(x) + i v(x)
ϕn* (x) = u(x) – iv(x)
ϕ’n (x) = u’(x) + i v’(x)
ϕ’n* (x) = u’(x) – iv’(x)
Análogamente para λ*n
ϕn* pues p(x), q(x) y r(x) son reales.
(r(x) ϕ*n’ )’ + [q(x) + λ*n p(x)] ϕ*n = 0
Esta surge de conjugar la E D de Sturm Liouville: significa que λ*n es valor
propio asociado con la función propia ϕ*n.
Entonces ϕn y ϕ*n pueden concebirse como dos funciones propias de valores
propios distintos. Por lo tanto deberán ser ortogonales.
b
b
ϕn ϕn* p(x) dx = 0. Esto significa que
a
ϕn
a
2
p(x) dx = 0
Como p(x) > 0
Es decir que necesariamente debe cumplirse u2(x) + v2(x) = 0 ⇒ u(x) = v(x) = 0
Esto implica que ϕn(x) =0.
Vale decir: la suposición de que el valor propio es complejo nos conduce a una
situación trivial. En consecuencia, las soluciones con funciones propias no
triviales corresponden a valores propios reales.
λn = real.
*
“Dos funciones propias con el mismo λ son linealmente dependientes”
Si observamos la (4) con λn = λm su segundo miembro es nulo.
Así obtenemos:
(r(x) ϕn’)’ ϕm - (r(x) ϕm’)’ ϕn =0.
Si integramos por partes entre a y x / x ∈ (a,b)
x
x
(r(t) ϕn’)’ ϕm dt - (r(t) ϕm’)’ ϕn dt =0
a
a
x
r(t) ϕn’ ϕm
x
a
x
x
r(t) ϕn’ ϕm’ dt – [r(t) ϕm’ϕn +
a
a
r(t) ϕn’ ϕm’ dt = 0
a
r(x) ϕn’(x) ϕm(x) - r(a) ϕn’(a) ϕm(a) - r(x) ϕm’(x) ϕn(x) + r(a) ϕn’(a) ϕm(a) = 0
Agrupando,
r(x) [ϕn’(x) ϕm(x) - ϕm’(x) ϕn(x)] – r(a) [ϕn’(a) ϕm(a) - ϕn’(a) ϕm(a)] = 0
Pero el corchete evaluado en a es nulo como ya hemos visto. Además r(x) >0,
Entonces
ϕn’(x) ϕm(x) - ϕm’(x) ϕn(x) = 0
ϕm(x)
O bien
ϕn(x)
W(x) =
= 0 ⇒ ϕm(x) y ϕn(x) son linealmente
ϕm’(x)
ϕn’(x)
dependientes.
La Serie de Fourier como Problema Periódico de Sturm Liouville
Sea
Con
y” + λ y =0
y(-L) = y(L) = 0;
y(-L) = y(L) = 0
En este caso vimos que:
λn = (n π/ L)2 y ahora los extremos a = -L; b = L
yn(x) = An cos (n π x/ L) + Bn sen (n π x/ L). Por linealidad escribimos:
∞
y(x) =
Σ An cos (n π x/ L) + Bn sen (n π x/ L) =
n=0
Siendo 1, cos (π x/ L), sen (π x / L), cos (2π x/ L), sen (2π x / L), ... las
aotofunciones.
Aquí p(x) = 1.
Entonces, multiplicando por cos (n π x/ L) o por sen (n π x/ L) e integrando
entre
–L y L se obtienen respectivamente:
L
Ao = 1/2L y(x) dx
para n=0;
-L
L
An = 1/L y(x) cos (n π x/ L) dx
-L
y
L
Bn = 1/L y(x) sen (n π x / L) dx, para n ≥ 1
-L
Polinomios Ortogonales
Una vez definido el producto interno entre dos funciones < f , g >, respecto a
una función de peso como:
a
(7) < f , g > =
f *(x) g(x) p(x) dx
b
∞
sea ahora un conjunto de polinomios ortogonales {Pn (x)} n=0,
donde Pn (x) es un polinomio de grado n.
Dicho conjunto forma un sistema ortogonal de polinomios con la función de
peso p(x) si:
b
Pn(x) Pm(x) p(x) dx = δmn Am
a
Donde
δmn se la conoce como “delta de Krönecker” y vale
1 si m=n
y 0 si m ≠ n,
y Am = norma del polinomio Pm(x); (A m> 0).
∞
Teorema: sea el conjunto de polinomios ortogonales {Pn (x)}
respecto de p(x). Sea Qk(x) un polinomio cualquiera
entonces P n (x) es ortogonal a Qk(x).
Demostración:
k
Qk(x) =
Σav xv;
v
v
tomemos x = Σ bu Pu(x),
v =0
u=0
v
con bu proporcionales a < x , Pu(x) >.
n=0
en [a,b]
con tal que k < n,
Luego,
k
v
Qk(x) = Σ av
Σ bu Pu(x),
v =0
u=0
k
< Pn , Qk > =
v
Σ av Σ bu < Pn, Pu>
v =0
=0
si n > k
u=0
Teorema: “Los ceros de los polinomios ortogonales son reales y simples”.
Sabemos que:
b
< Qk, Pn+1 > = Q*k Pn+1 p(x) dx =0 ∀ k<n
a
Supongamos ahora que Pn+1(x) no tiene raíces reales (no cruza el eje x).
b
Por lo tanto, si Qk (x) =1;
1 Pn+1 p(x) dx ≠ 0
a
pero debe dar cero, en consecuencia tiene al menos una raíz real. Sea α esa
raíz. Tomemos Qk (x) = (x - α ); Pn+1(x) = (x - α ) Sn(x).
Luego, < Pn+1(x), (x - α) > = 0
b
2
Pero < Pn+1(x), (x - α) > =
(x - α ) Sn(x) p(x) dx será distinto de cero si Sn(x)
a
no tiene raíz real. Así, como la integral debe dar cero, entonces se deduce que
Sn(x) tiene al menos una raíz real. Y así sucesivamente.
En definitiva Pn+1(x) tiene n+1 raíces reales.
Todas estas raíces reales son, además, simples porque, del razonamiento
anterior, se tiene que:
Si m ≥ 2:
m
(x - α) Sn+1-m(x) = Pn+1(x).
Sea Qk(x) = (x - α) Sn+1-m(x). (Analizamos el caso m = impar, dejando por
analogía el caso de m = par). m ≥ 3.
Note que: k = n+1 – m + 1 = n+1 – (m-1) < n+1
b
Qk(x) Pn+1 p(x) dx = 0
a
b
m
(x - α) Sn+1-m(x) (x - α) Sn+1-m(x) p(x) dx
a
b
m+1
(x - α)
2
[Sn+1-m(x)] p(x) dx
es distinto de cero pues m+1 es par y
a
2
el [corchete] y p(x) son positivos. Pero debe dar cero!! porque k < m+1.
⇒ < Pn+1(x), Qk(x) > = 0
Esta contradicción a su vez implica que m no puede ser ≥ 2. Entonces las
raíces son simples.
Propiedades Fundamentales de los Polinomios Ortogonales
Unicidad
Dados el intervalo [a, b] y p(x) > 0, el conjunto de polinomios ortogonales
{Pn(x)}; n = 0, 1, 2,... es único.
b
Es decir:
Pn(x) Pm(x) p(x) dx
a
b
=
Qn(x) Qm(x) p(x) dx
⇒ Pn(x) = Qn(x).
a
∀ n ∈ No
(Se trata de un problema de Sturm Liouville: dada una misma p(x) debe haber
una misma solución).
Recurrencia
Los polinomios ortogonales están relacionados de tal modo que para tres “n”
consecutivos Pk-1(x), Pk(x), Pk+1(x) tienen una vinculación algebraica sencilla.
Probaremos que Pn+1(x) = (an x + bn) Pn(x) – cn Pn-1(x).
Fijemos n y dejemos sin subíndices a an, bn y cn por sencillez. Entonces
demostraremos que:
Pn+1(x) = (ax+b) Pn(x) – c Pn-1(x).
Si ajustamos a para que se cancelen los términos de grado n+1
a x Pn(x) - Pn+1(x) = Qn(x), polinomio de grado “n”.
Si ajustamos ahora b para que se cancelen los términos resultantes de grado
“n”, quedará un polinomio de grado n-1.
En consecuencia:
n-1
(8) (ax+b) Pn(x) - Pn+1(x) = Rn-1(x) = Σ λi Pi(x).
i =0
(Pues todo polinomio Rn-1(x) puede expresarse como combinación lineal de los
Pi(x) para i = 0, 1, 2,..., n-1).
Elijamos j ≤ n-2 para hacer productos internos con Pj(x).
n-1
< (ax+b) Pn(x), Pj(x) > - < Pn+1(x), Pj(x) > = Σ λi <Pi(x), Pj(x)> =
i =0
= λj < Pj(x), Pj(x) > =λj
Pj(x)
2
=0
Porque
< Pn+1(x), Pj(x) > =0
< ax Pn(x), Pj(x) > = < a Pn(x), xPj(x) > = 0 porque j+1 < n
< b Pn(x), Pj(x) > = 0
Entonces λj
Pj(x)
2
= 0 implica que los λj deben ser nulos para todos los
j ≤ n-2. Así, de la (8), λj = 0 para j = 0, 1, ..., n-2
En consecuencia,
(ax+b) Pn(x) - Pn+1(x) = λn-1 Pn-1(x). Ahora hagamos c= λ
n-1
y nos queda
demostrada la relación de recurrencia.
(9)Pn+1(x) = (ax+b) Pn(x) - c Pn-1(x)
Forma General de la Ecuación Diferencial Lineal Homogénea de
Segundo Orden
Veremos que la expresión general de esta ecuación puede concebirse con la
forma de Sturm Liouville
(10)P(x) y” + Q(x) y’ + R(x) y = 0
Suponiendo que P(x) no se anula en (a, b), dividimos la (10) y nos queda:
(11) y” + Q/P y’ + R/P y = 0.
Hagamos r(x) = e
∫ Q/P dx
r’(x) = Q/P e
∫ Q/P dx
Multiplicando la (11) por r(x) obtenemos:
y” r + Q/P. r y’ + R/P . r y = 0
y” r + r’ y’ + R/P . r y = 0
Que puede escribirse como (y’ r )’ + R/P . r y = 0 que es la forma de Sturm
Liouville.
Si hacemos finalmente R/P .r = λ ω(x) – q(x) ;
(12)
(y’ r)’ + (λ
λ ω(x) – q(x)) y = 0
Por ejemplo, la ecuación diferencial de Bessel es:
2
2
2
2
x y” + x y’ + ( x λ - ν ) y = 0
2
2
(x y’)’ + ( x λ - ν / x) y = 0 .
Ecuaciones Diferenciales que conducen a Polinomios Ortogonales
Sea Q(x) un polinomio de grado ≤ 2 en x.
Sea L(x) un polinomio lineal en x.
La ecuación diferencial
(13)
Q(x) y” + L(x) y’ + λ y = 0
Si r(x) = e
∫ L/Q dx
y W(x) = r / Q, las soluciones de la ecuación diferencial (13)
son polinomios ortogonales. Dependiendo de la forma y grados de L(x) y Q(x)
se obtienen las ecuaciones diferenciales de Legèndre, Hermite, Laguerre,
Jacobi, etc. y los polinomios solución son los polinomios homónimos.
La función W(x) es la función de peso para ortogonalidad en cada caso.
Fórmula de Rodrigues
Una famosa fórmula, cuya deducción es un tanto delicada para colocarla aquí,
es la Fórmula de Rodrigues, la cual permite obtener en cada caso los
polinomios antedichos.
Ésta es:
(14)
Pn (x) = 1 / [en W(x)] { d n / dx n (W(x) [Q(x)]n) } .
El coeficiente en depende de cada caso y figura en las tablas correspondientes
(ver páginas siguientes).
Preparó: Ing. Eduardo S. Serdoch
Mendoza, Julio de 2006
Bibliografía
Matemáticas Avanzadas para Ingeniería Quinta Edición Peter V. O’Neil Ed.
Thomson.
Matemáticas Avanzadas para Ingeniería Quinta Edición Vol I Erwin Kreyszig
Ed. Limusa.
Sitio Web Wikipedia: Orthogonal Polynomials; Sturm Liouville Theory, etc.
Descargar