Electromecánica Prof. Dr. Francisco Javier Gil Chica Octube de 2012 1 2 I Repaso de Cálculo 1 Integrales de camino 1.1 Formas de la integral de camino Una integral de camino en dos dimensiones tiene la forma: P (x, y)dx + Q(x, y)dy (1) P (x, y, z)dx + Q(x, y, z)dy + R(x, y, z)dz (2) y en tres dimensiones: Z Z Sin pérdida de generalidad y para aligerar notación, restringimos la discusión al caso bidimensional. En (1), x e y no son independientes, sino que existe una relación funcional entre ellas de la forma y(x). Si la curva y(x) está dada en forma paramétrica mediante un par de relaciones x = ϕ(t) y = ψ(t) (3) entonces la integral de camino se reduce a una integral ordinaria Z [P (ϕ(t), ψ(t))ϕ′ (t) + Q(ϕ(t), ψ(t))ψ ′ (t)]dt (4) Ejemplo: calcular α= Z (2,0) (0,2) xydx (5) a lo largo de la lı́nea que une el punto (2, 0) con el punto (0, 2). Solución: la ecuación de la recta es y = 2 − x, de manera que α= En forma paramétrica: Z x=0 x=2 x(2 − x)dx = − x = t y = 2−t 3 4 3 (6) (7) y 4 (8) 3 t=0 Parece que no hay ventaja alguna en la representación paramétrica, pero si elegimos para integrar el arco de circunferencia en el primer cuadrante que une el punto (2, 0) con el punto (0, 2), entonces la representación paramétrica se vuelve ventajosa, porque el arco viene dado por α= Z t=2 t(2 − t)dt = − x = 2 cos t y = 2 sin t (9) donde t varı́a entre 0 y π/2 y 8 (10) 3 t=0 Obsérvese, de entrada, que la integral de camino depende de la trayectoria elegida. Otra forma para las integrales de camino es α= Z t=π/2 2 cos t × 2 sin t × (−2) sin tdt = − α= Z B A g(x, y)ds (11) donde ds es un diferencial del camino que une A y B. Del teorema de Pitágoras: ds = con lo cual q q (dx)2 + (dy)2 = dx 1 + (y ′ )2 α= Z B A q g(x, y) 1 + (y ′ )2 dx (12) (13) Si el camino se da en forma parametrizada: x = ϕ(t) y = ψ(t) (14) entonces dx = ϕ′ dt, dy = ψ ′ dt y ds = con lo que α= Z B A q (ϕ′ )2 + (ψ ′ )2 dt (15) q (16) g(ϕ(t), ψ(t)) (ϕ′ )2 + (ψ ′ )2 dt 4 1.2 Trabajo El trabajo que una fuerza desarrolla al mover un punto a lo largo de una trayectoria viene dado por una integral de camino: T = Z B A F̄ .dr̄ (17) donde F̄ = Fx (x, y, z)î + Fy (x, y, z)ĵ + Fz (x, y, z)k̂ y dr̄ = dxî + dy ĵ + dz k̂. Ejemplo: calcular el trabajo de una fuerza aplicada a un punto que se mueve en el arco de circunferencia que une los puntos (0, 2) y (2, 0), cuya dirección apunta siempre a (2, 0) y cuyo módulo es proporcional a la distancia a (2, 0), con constante de proporcionalidad k. Solución: la fuerza se expresa como F̄ = kū, donde ū es el vector (2 − x)î − y ĵ. Entonces T =k Z (2,0) (0,2) (2 − x)dx − ydy (18) Usando la forma paramétrica para la trayectoria x = 2 sin t y = 2 cos t (19) tenemos T = 4k 1.3 "Z t=π/2 t=0 (1 − sin t) cos tdt + Z t=π/2 t=0 # cos t sin tdt = 4k (20) Independencia del camino Es importante el caso en que la integral de camino tiene el mismo valor independientemente de la trayectoria elegida. Es lo que ocurre en los llamados ”campos conservativos”. La integral de camino depende entonces sólo de los puntos inicial y final de la trayectoria. ¿En qué condiciones ocurre esto? Demostraremos que la condición necesaria y suficiente para que la integral de camino α= Z B A P (x, y)dx + Q(x, y)dy (21) dependa únicamente de A y B es que ∂P ∂Q = ∂y ∂x 5 (22) Necesidad: Si existiese una z(x, y) tal que dz = ∂z ∂z dx + dy = P (x, y)dx + Q(x, y)dy ∂x ∂y (23) es decir: ∂z = P (x, y) ∂x ∂z = Q(x, y) ∂y (24) entonces α= Z B A P (x, y)dx + Q(x, y)dy = Z B A dz = zB − zA (25) En resumen, si α es independiente del camino, significa que el integrando es un dz, lo que implica (24), lo que implica (22), ya que ∂ 2z ∂ 2z = ∂x∂y ∂y∂x (26) Z (27) Suficiencia: Llamamos f (x, y) = ası́ que, manteniendo y fija: P (x, y)dx ∂f = P (x, y) ∂x (28) ∂ 2f ∂P ∂Q = = ∂x∂y ∂y ∂x (29) de donde de donde ∂Q ∂ 2f ∂ ∂f 0= − = Q− ∂x ∂x∂y ∂x ∂y ! (30) y de aquı́ Q− ∂f = φ(y) ∂y Llamamos ahora 6 (31) z(x, y) = f (x, y) + Z φ(y)dy (32) ∂f ∂z = + φ(y) = Q(x, y) ∂y ∂y (33) de donde, de (31) y (32): y también, de (28) ∂f ∂z = ∂x ∂x P (x, y) = (34) es decir, que P (x, y)dx + Q(x, y)dy = ∂z ∂z dx + dy = dz ∂x ∂y (35) y por tanto α es independiente del camino elegido. 2 Integrales dobles Para introducir el concepto de integral doble, consideremos el problema de calcular el volumen de un prisma recto cuya base es una curva cerrada C en el plano xy. Las generatrices del prisma son paralelas al eje z. Para cada punto (x, y) del interior de C, la altura del prisma es z(x, y). El volumen del prisma es entonces la suma de los volúmenes de los prismas rectos de base cuadrangular, de lados dx y dy y alturas z(x, y), es decir: V = Z z(x, y)dxdy (36) Esta es una forma simbólica de expresar el volumen, pero no nos indica cómo efectuar el cálculo. Una forma es dividiendo el volumen en láminas de anchura dx. Entonces, para un x = constante, el area de la lámina es Z y=β y=α z(x, y)dy (37) donde los limites de integración α y β son funciones de x. De hecho, son los puntos en que la lı́nea x = constante corta a C. El volumen de la lámina es dx Z y=β y=α z(x, y)dy y el volumen total: 7 (38) Z x=η x=ξ dx Z y=β y=α z(x, y)dy (39) donde x = ξ y x = η son las tangentes a C paralelas al eje y. Es obvio también que obtenemos el mismo volumen si tomamos láminas paralelas del al eje x en lugar de láminas paralelas al eje y. En ese caso, el área de cada lámina se expresarı́a como una integral en x, con lı́mites de integración dependientes de y. Aunque hemos introducido la integral doble en relación R con un problema particular, es claro que f (x, y)dxdy es un ente matemático que no requiere de interpretación fı́sica, como tampoco la requiere la integral R f (y)dy. Ejemplo: Calcular Z 2xydxdy (40) √ sobre el recinto limitado por las curvas y = x2 , y = x, x = 0 y x = 1/2. Los pasos a seguir son: a) hacerse una representación del recinto de integración; b) obtener los lı́mites de la integral en y como función de x; c) integrar en y y d) integrar en x, que en este caso varı́a entre 0 y 1/2. Ası́, tenemos Z 2.1 x=1/2 x=0 dx "Z √ y= x y=x2 # 2xydy = Z x=1/2 x=0 dx(x2 − x5 ) = 5 128 (41) Cambio de variable Consideremos el cambio de variables x = f (u, v) e y = g(u, v). En el plano (u, v), el punto (u, v) se corresponde en el plano (x, y) con (f (u, v), g(u, v)). Por su parte, el punto (u + du, v) se transforma en ∂f ∂f du = x + du ∂u ∂u ∂g ∂g g(u + du, v) = g(u, v) + du = y + du ∂u ∂u f (u + du, v) = f (u, v) + (42) De igual forma, (u, v + dv) se transforma en ∂f ∂f dv = x + dv ∂v ∂v ∂g ∂g g(u, v + dv) = g(u, v) + dv = y + dv ∂v ∂v f (u, v + dv) = f (u, v) + 8 (43) Ası́, la región de área dudv en el plano (u, v) se transforma en un área en el plano (x, y). Este área se puede calcular como el módulo del producto vectorial de los vectores de origen (x, y) y extremos dados por las ecuaciones (42) y (43), ā y b̄ en la Figura 1, de tal manera que la relación entre las áreas elementales es ∂(f, g) dxdy = dudv ∂(u, v) (44) Figura 1 Por consiguiente, si la transformación lleva de la región S a la región D, tenemos que Z ∂(f, g) dudv z(x, y)dxdy = Z(u, v) ∂(u, v) S D Z (45) donde Z(u, v) = z(x(u, v), y(u, v)). 2.2 El teorema de Green El teorema de Green relaciona la integral de superficie con la circulación sobre el contorno de esa superficie. Establece que Z S ∂Q ∂P − ∂x ∂y ! dxdy = Z C (P dx + Qdy) (46) Demostración: Consideramos una curva γ convexa cerrada en el plano (x, y). Sea A el punto de la curva con la coordenada x = a mı́nima, B el 9 punto de la curva con la coordenada y = b mı́nima, C el de coordenada x = c máxima y D el de coordenada y = d máxima. Ası́, la curva está incrita en un rectángulo de lados c − a y d − b. Llamamos θ1 (x) a la curva ABC, y θ2 (x) a la curva ADC. Tenemos que Z γ P (x, y)dx = = Z Z x=c x=a x=c x=a P (x, θ1 (x))dx + Z x=a x=c P (x, θ2 (x))dx [P (x, θ1 (x)) − P (x, θ2 (x))]dx (47) Por otro lado Z S Z x=c Z y=θ2 (x) ∂P ∂P dxdy = dy dx ∂y x=a y=θ1 (x) ∂y = Z x=c x=a [P (x, θ2 (x)) − P (x, θ1 (x))] (48) de donde se sigue que Z γ P dx = − Z S ∂P dxdy ∂y (49) y por análogo razonamiento Z γ Qdy = Z S ∂Q dxdy ∂x (50) lo que demuestra el teorema. Ejemplo: Deseamos calcular Z C (2y 2 − x2 )dx + (3x2 − y 2 )dy (51) sobre la circunferencia y 2 + (x − a)2 = a2 , que tiene la forma paramétrica x = a(1 + cos t) y = a sin t (52) donde t varı́a entre 0 y 2π. Esta integral puede sustituirse por una de superficie, más sencilla de calcular, usando el teorema de Green. En efecto: Z 2 C 2 2 2 (2y − x )dx + (3x − y )dy = 10 Z S (6x − 4y)dxdy (53) La primera parte es Z S 6xdxdy = Z a dy −a Z x2 (y) x1 (y) 6xdx = 3 Z a h dy x2 −a ix2 (y) x1 (y) (54) √ √ con x1 (y) = a − a2 − y 2 y x2 (y) = a + a2 − y 2 , resultando finalmente 6πa3 . La integral que contiene 4y se puede comprobar que es nula. Por consiguiente, Z 3 C (2y 2 − x2 )dx + (3x2 − y 2 )dy = Z S (6x − 4y)dxdy = 6πa3 (55) Integral de superficie Se define Z F (x, y, z)dS (56) sobre una región A de la superficie z(x, y) como Z A q F (x, y, z(x, y)) 1 + zx2 + zy2 dxdy (57) Por tanto, la integral de superficie ası́ definida no es más que una integral doble, ya vista. Pero ilustremos el cálculo de este tipo de integrales con un ejemplo. Sea Z S (x2 + y 2 − 3z 2 )dS (58) sobre la superficie superior (z > 0) de la esfera x2 + y 2 + z 2 = 4. El elemento de superficie es dS = √ dxdy 4 − x2 − y 2 (59) La integral que buscamos es entonces: 8 Z y=2 y=−2 dy Z x2 (y) x1 (y) x2 + y 2 − 3 √ dx 4 − x2 − y 2 (60) Vemos que los lı́mites de integración para x dependen de y. Serı́a más sencillo si los lı́mites de cada integral fuesen independientes, lo que se consigue con el cambio a coordenadas polares (r, θ), que son ambas independientes. En polares: 11 x = r cos θ y = r sin θ (61) y el cambio de variables exige el cálculo del determinante del jacobiano, que es ∂(x, y) =r ∂(r, θ) (62) ası́ que, finalmente, calculamos Z 4 θ=2π θ=0 dθ Z r=2 r=0 8r(r2 − 3) 32 √ π = − 3 4 − r2 (63) Cálculo vectorial 4.1 Gradiente Dada una función f (x, y, z), se define el vector gradiente como grad(f ) = ∂f ∂f ∂f , , ∂x ∂y ∂z ! (64) Su interpretación es la siguiente: dada la familia de superficies f (x, y, z) = constante, el vector gradiente en el punto (x, y, z) es perpendicular a la superficie f (x, y, z) = constante a la que pertenece el punto y apunta hacia valores crecientes de c. En efecto, entre dos puntos próximos pertenecientes a la misma superficie: df = ∂f ∂f ∂f dx + dy + dz = 0 ∂x ∂y ∂z (65) es decir, que los vectores grad(f ) = ∂f ∂f ∂f k̂ î + ĵ + ∂x ∂y ∂z (66) y dr̄ = dxî + dy ĵ + dz k̂ (67) son perpendiculares, ya que su producto escalar es nulo. Pero como dr̄ se encuentra sobre la superficie, grad(f ) es perpendicular a ella. Por otro 12 lado, si P (x, y, z) es un punto que se encuentra sobre la superficie c y R(x + dx, y + dy, z + dz) un punto que se encuentra sobre la superficie c′ , en la perpendicular a c por P , entonces, si llamamos dr̄ = P R, será dr̄ paralelo al gradiente, de donde dx dy dz = = = fx fy fz q (dx)2 + (dy)2 + (dz)2 q fx2 + fy2 + fz2 =q dn fx2 + fy2 + fz2 (68) donde dn es la distancia entre las superficies c y c′ ; entonces, al pasar de q ′ 2 c a c por la perpendicular a P , sustituyendo dx = fx dn/ fx + fy2 + fz2 y análogamente para dy y dz: df = q ∂f ∂f ∂f ∂f dx + dy + dz = fx2 + fy2 + fz2 dn = dn ∂x ∂y ∂z ∂n (69) de donde se sigue que ∂f (70) ∂n Al pasar de c a c′ no a lo largo de la perpendicular, sino en una dirección que forma un ángulo θ con la perpendicular y a lo largo de un ds, entonces |grad(f )| = q fx2 + fy2 + fz2 = ∂f dn ∂f ∂f = = cos θ ∂s ∂n ds ∂n Si ŝ es la dirección de ds y n̂ la normal, ∂f ∂f ∂f = (ŝ · n̂) = ŝ · n̂ = ŝ · grad(f ) ∂s ∂n ∂n Se introduce el operador vectorial ∇ como ∇= ∂ ∂ ∂ î + ĵ + k̂ ∂x ∂y ∂z (71) (72) (73) de forma que se puede escribir grad(f ) = ∇f (74) Ejemplo: Dada la función r2 = x2 + y 2 + z 2 , calcular su gradiente. Se ve que ∂r2 = 2x ∂x y análogamente para las otras dos coordenadas, de donde 13 (75) ∇r2 = 2r̄ (76) Ejemplo: si f (r) es una función arbitraria de r = su gradiente. Se ve que √ x2 + y 2 + z 2 , calcular ∂f (r) ∂f (r) ∂r x = = f ′ (r) ∂x ∂r ∂x r y análogamente para las otras coordenadas, de donde, finalmente (77) f ′ (r) r̄ = f ′ (r)r̂ (78) r Si f1 (x, y, z) y f2 (x, y, z) son dos funciones escalares, continuas y derivables, de las reglas elementales de derivación se sigue que ∇f (r) = ∇(f1 + f2 ) = ∇f1 + ∇f2 ∇(f1 f2 ) = f2 ∇f1 + f1 ∇f2 4.2 (79) Campos vectoriales irrotacionales Un campo vectorial V̄ (x, y, z) es una función que a cada punto (x, y, z) del espacio asigna un vector de componentes (V1 (x, y, z), V2 (x, y, z), V3 (x, y, z)). La circulación de un campo vectorial sobre una curva ya la definimos implı́citamente en 1.2, ecuación (17). El trabajo es entonces la circulación de la fuerza a lo largo de la trayectoria. Para un campo vectorial cualquiera V̄ (x, y, z) a lo largo de una trayectoria C, la circulación es Z C V̄ · dr̄ (80) y si la trayectoria viene dada en la forma paramétrica (x(t), y(t), z(t)), entonces la circulación es Z β α ! dx dy dz V1 + V2 + V3 dt dt dt dt (81) donde α y β son los valores de t en los extremos de la trayectoria. Si la trayectoria es cerrada, se suele usar el sı́mbolo I 14 (82) En (1.3) demostramos la condición que debe cumplir un campo vectorial para que su circulación sea independiente del camino, aunque allı́ no habı́amos todavı́a introducido el término ”campo vectorial”. La extensión obvia al caso tridimensional de aquella condición es que sea ∂V1 ∂V2 = ; ∂y ∂x ∂V1 ∂V3 = ; ∂z ∂x ∂V2 ∂V3 = ∂z ∂y (83) Un campo vectorial se llama irrotacional si su circulación a lo largo de cualquier trayectoria cerrada es nula. Ahora demostraremos dos resultados importantes: a) si un campo V̄ es irrotacional, existe una función escalar f tal que V̄ = ∇f . b) Si f es una función escalar, su gradiente es irrotacional. Demostración de a): Elegimos como trayectoria cerrada una que va desde el punto A al punto B pasando por P y vuelve de B a A pasando por Q, de forma que I V̄ · dr̄ = Z AP B V̄ · dr̄ + Z BQA V̄ · dr̄ = 0 (84) lo que implica que Z AP B =− Z BQA = Z AQB (85) y por tanto la integral es independiente de la trayectoria. Si fijamos A, Z AB (86) es una función sólo de B, pero como dicha integral es un escalar, entonces Z AB V̄ · dr̄ = f (B) (87) Si B ′ es un punto próximo de B: de manera que Z AB ′ V̄ · dr̄ = f (B ′ ) f (B ′ ) − f (B) = df = V̄ · dr̄ (88) (89) pero sabemos que el incremento df de una función escalar entre dos puntos separados por dr̄ es ∇f · dr̄, de donde (V̄ − ∇f ) · dr̄ = 0 15 (90) y finalmente V̄ = ∇f , ya que dr̄ es arbitrario. Demostración de b): Si f es una función escalar, la circulación de su gradiente en un circuito cerrado es I ∇f · dr̄ = I df = 0 (91) Ejemplo: Dado el campo vectorial V̄ = (3x2 y + zy 2 )î + (x3 + 2xyz)ĵ + y 2 xk̂ (92) a) demostrar que es irrotacional; b) encontrar la función escalar f de la cual deriva y c) calcular su circulación entre los puntos A = (1, 2, 3) y B = (2, 4, 12) a lo largo de la curva x(t) = t y(t) = 2t z(t) = 3t2 (93) a) Para demostrar que es irrotacional, basta con derivar y comprobar que se cumplen las condiciones: ∂V1 ∂V2 = ; ∂y ∂x ∂V1 ∂V3 = ; ∂z ∂x ∂V2 ∂V3 = ∂z ∂y (94) b) de V1 = 3x2 y + zy 2 = fx se sigue que ha de ser f (x, y, z) = x3 y + zxy 2 + g(y, z) (95) Derivando respecto a y e igualando a V2 : x3 + 2xyz + ∂g = x3 + 2xyz ∂y (96) de donde se sigue que ∂g =0 ∂y (97) o g = h(z) salvo constante. Luego f (x, y, z) = x3 y +zxy 2 +h(z). Derivando respecto a z e igualando a V3 vemos que ha de ser h(z) = c, y como V̄ se obtiene de f por derivación, esa constante no tiene importancia, ası́ que, finalmente 16 f (x, y, z) = x3 y + zxy 2 (98) c) En representación paramétrica, el punto A corresponde a t = 1 y el punto B a t = 2. Entonces Z AB V̄ · dr̄ = Z ! dy dz dx + V2 + V3 dt V1 dt dt dt t=2 t=1 (99) Sustituyendo y efectuando las integrales, se obtiene el resultado Z 4.3 V̄ · dr̄ = 402 AB (100) Integral de superficie Se puede reformular ligeramente y adaptar al formato vectorial el concepto de integral de superficie presentado en la sección 4. Si un elemento de superficie lo representamos no mediante un escalar sino mediante un vector cuyo módulo es dS y cuya dirección es normal a la superficie (si la superficie es cerrada, la normal se tomará hacia afuera): dS̄ = n̂dS (101) Entonces redefinimos la integral de superficie como Z S V̄ · dS̄ = Z V̄ · n̂dS = S Z S (V̄ · n̂)dS (102) y como el producto escalar es un escalar, la integral anterior es del tipo escalar considerado antes, en (56) 4.4 Flujo y divergencia Dado un elemento de superficie dS̄ que contiene un punto P en el cual el campo vectorial toma un valor V̄ , se define el flujo del campo a través del elemento de superficie como dφ = V̄ · dS̄ (103) A partir de aquı́, dada una superficie cerrada que encierra un cierto volumen y un punto P interior a ese volumen, se define la divergencia del campo vectorial en el punto P como el ∆φ ∆v→0 ∆v lim 17 (104) es decir, la relación entre el flujo que atraviesa la superficie y el volumen contenido en la misma, cuando éste tiende a cero. Para dar con una forma operativa de calcular la divergencia, consideramos un pequeño cubo de lados dx, dy, dz paralelos a los ejes coordenados. Consideremos las caras perpendiculares al eje x, una en x y otra en x + dx. La normal a la primera cara es (−1, 0, 0), y la normal a la segunda cara es (1, 0, 0). El módulo de la superficie de ambas caras en dydz. El campo en la primera cara es V̄ , y el campo en la segunda: ∂ V̄ dx (105) ∂x El flujo total a través de ambas caras (flujo a través de la primera más flujo a través de la segunda) es V̄ + ∂V1 dxdydz (106) ∂x y análogamente para las caras paralelas a los ejes y y z, de tal forma que el flujo total a través del cubo es dφx = dφ = dφx + dφy + dφz = ! ∂V1 ∂V2 ∂V3 + + dxdydz ∂x ∂y ∂z (107) y de la definición de divergencia, vemos que div(V̄ ) = ∂V1 ∂V2 ∂V3 + + ∂x ∂y ∂z (108) que se puede escribir simbólicamente usando el operador nabla: div(V̄ ) = ∇ · V̄ (109) ∇ · (f Ū ) = ∇f · Ū + f ∇ · Ū (110) Ejemplo: si V̄ = x3 y î + y 3 z ĵ + z 2 k̂, entonces ∇ · V̄ = 3x2 y + 3y 2 z + 2z. Obsérvese que la divergencia es un escalar. Cuando el campo vectorial es de la forma f Ū , siendo f una función escalar, se comprueba por simple derivación que Ejemplo: Si V̄ = f (r)r̄, calcular la divergencia. Sabemos que el gradiente de la parte escalar es (segundo ejemplo, 4.1) ∇f = f ′ (r)r̂ y que 18 (111) ∇ · r̄ = 3 ası́ que (112) ∇ · (f (r)r̄) = rf ′ (r) + 3f (r) (113) 2 2 Como caso particular de este caso particular: ∇ · (r r̄) = 5r . 4.5 Campos solenoidales Un campo es solenoidal si su divergencia es nula en todo punto. Por ejemplo, el campo V̄ = rn r̄ es solenoidal sólo para n = −3. En efecto: ∇ · V̄ = nrn + 3rn = (n + 3)rn (114) que es cero sólo para n = −3. ¿Qué implica que un campo sea solenoidal? que el flujo a través de cualquier superficie cerrada es nulo, lo que significa, a su vez, que las lı́neas de campo no tienen ni fuentes ni sumideros. Esto se cumple para el campo eléctrico en regiones libres de cargas, y para el campo magnético siempre. Ejemplo: el campo V̄ = yz î + zxĵ + xy k̂ es a la vez irrotacional y solenoidal. En efecto, por cálculo directo se ve que es irrotacional; por ejemplo: ∂ ∂ (yz) = (zx) ∂y ∂x etc. Que es solenoidal se ve calculando la divergencia: ∇ · V̄ = 4.6 ∂ ∂ ∂ (yz) + (zx) + (xy) = 0 ∂x ∂y ∂z (115) (116) Teorema de la divergencia El teorema de la divergencia afirma que si S es una superficie que encierra un volumen V en el que está definido un campo vectorial Ū , entonces Z V ∇ · Ū dV = Z S Ū · dS̄ (117) Se puede dar de este teorema una demostración cualitativa. A tal efecto, divı́dase mentalmente el volumen V en un número muy grande de pequeños volúmenes adyacentes. El flujo a través de un elemento de superficie que separa dos volúmenes adyacentes es nulo, porque, sea cual sea en este elemento 19 el valor del campo, aparecerá una vez Ū · dS̄ y otra −Ū · dS̄ al considerar las normales hacia el exterior de los dos pequeños volúmenes que comparten la misma frontera dS̄. Por tanto, el flujo total interior al volumen es nulo, ya que cualquier pequeño elemento es adyacente a otro, con el que comparte una superficie de separación. Ası́ que sólo quedan sin compensar los elementos de volumen limitados parcialmente por la superficie exterior S. De la definición de la divergencia, vemos que la suma para el conjunto de todos los elementos de volumen ha de ser igual al flujo neto total que atraviesa S. Ejemplo: Calcular Z S r̄ · dS̄ (118) sobre una superficie cerrada. Solución: como Z S r̄ · dS̄ = Z V ∇ · r̄dV (119) y ∇ · r̄ = 3, se sigue que la integral buscada es 3V . Ejemplo: calcular, Z S Ā · dS̄ (120) donde S es la esfera centrada en el origen de radio R y Ā = x3 î+y 3 ĵ +z 3 k̂. Solución: como ∇ · Ā = 3(x2 + y 2 + z 2 ): Z S Ā · dS̄ = 3 Z V (x2 + y 2 + z 2 )dxdydz (121) Para calcular esta integral pasamos a coordenadas polares esféricas. El jacobiano de la transformación es r2 sin θ, ası́ que la integral es 3 4.7 Z 2π 0 dφ Z π 0 dθ sin θ Z r 0 r4 dr = 12 5 πR 5 (122) Identidades de Green Hemos visto que, dado un campo vectorial de la forma V̄ = f Ū , su divergencia es ∇ · V̄ = (∇f ) · Ū + f ∇ · Ū Cuando Ū es a su vez el gradiente de un campo escalar g: 20 (123) ∇ · V̄ = (∇f ) · (∇g) + f (∇ · ∇g) (124) Se escribe abreviadamente ∇ · ∇ = ∇2 , y se le llama operador laplaciano: ∇2 = ∂2 ∂2 ∂2 + + ∂x2 ∂y 2 ∂z 2 (125) ası́ que ∇ · V̄ = (∇f ) · (∇g) + f ∇2 g (126) y aplicando el teorema de la divergencia: Z V ∇ · V̄ dV = Z V [(∇f ) · (∇g) + f ∇2 g]dV = Z S f (∇g) · dS̄ (127) que es la primera identidad de Green. Intercambiando f y g y restando se obtiene la segunda identidad de Green: Z 4.8 V (f ∇2 g − g∇2 f )dV = Z S [f (∇g) − g(∇f )] · dS̄ (128) El rotacional De forma similar a la divergencia, que se define como el lı́mite entre el flujo que atraviesa una superficie cerrada y el volumen encerrado por la misma, cuando éste tiende a cero, se define el rotacional en un punto P como un vector en la dirección normal a una superficie dS que contiene a P cuyo módulo es el lı́mite cuando dS → 0 entre la circulación sobre el contorno γ de dS y la misma dS: ∆C (129) ∆S→0 ∆S Y al igual que con la divergencia, necesitamos aquı́ un procedimiento de cálculo que no da la propia definición. Para ver cómo se expresan las componentes del rotacional, vamos a considerar la componente k̂, para lo cual consideramos un pequeño circuito en el plano xy que contiene el punto P de coordenadas (x, y, 0). Las coordenadas de un punto del contorno se expresan como r̄ = (x + x′ , y + y ′ , 0). En cuanto al campo en los puntos del contorno, se puede desarrollar en serie de Taylor alrededor del punto P , y escribir: rot(Ū ) = lim U1 (x + x′ , y + y ′ , 0) = U1 (x, y, 0) + 21 ∂U1 ′ ∂U1 ′ x + y ∂x ∂y (130) y de la misma forma U2 (x + x′ , y + y ′ , 0) = U2 (x, y, 0) + ∂U2 ′ ∂U2 ′ x + y ∂x ∂y (131) La circulación que buscamos es Z γ Ū · dr̄ = Z γ U1 (x + x′ , y + y ′ , 0)dx′ + U2 (x + x′ , y + y ′ , 0)dy ′ (132) Insertando los desarrollos en serie de Taylor, y como las componentes del campo y las derivadas pueden salir de las integrales, ya que se evalúan en P , quedan las integrales curvilı́neas siguientes: Z γ Z Z γ dx′ = 0 (133) dy ′ = 0 (134) 1 x′ dx′ = x′2 |γ = 0 2 γ (135) 1 y ′ dy ′ = y ′2 |γ = 0 2 γ (136) Z y usando (49) y (50) que fueron encontradas en la demostración del teorema de Green, Z Z γ x′ dy ′ = ∆S (137) y ′ dx′ = −∆S (138) γ Se tiene finalmente que ∆C ∂U1 ∂U2 = − (139) ∆S ∂y ∂x Como el segundo miembro es una función de sólo las coordenadas del punto P , al hacer el lı́mite ∆S → 0 se tiene el rotacional que es precisamente ese segundo miembro. Análogamente para el resto de componentes, lo que nos darı́a: rot(Ū ) = ! ! ! ∂U2 ∂U3 ∂U3 ∂U1 ∂U1 ∂U2 − − − k̂ î + ĵ + ∂z ∂y ∂x ∂z ∂y ∂x 22 (140) y recordando la definición del operador ∇, vemos que se puede poner rot(Ū ) = ∇ × Ū (141) Se demuestran sin dificultad, de la definición del rotacional y las propiedades de la derivación, los resultados siguientes: a) Si Ū y V̄ son dos campos vectoriales, entonces el rotacional de Ū + V̄ es la suma de los rotacionales. b) Si Ū es un campo vectorial y f una función escalar, entonces ∇ × (f Ū ) = (∇f ) × Ū + f ∇ × Ū (142) c) Para cualquier función escalar f , ∇ × (∇f ) = 0̄ (143) d) Para cualquier función vectorial Ū ∇ · (∇ × Ū ) = 0 4.9 (144) Campos vectoriales irrotacionales Si la circulación de un campo a lo largo de una trayectoria entre dos puntos depende sólo de los extremos, entonces la circulación en cualquier trayectoria cerrada es nula, y por la definición, el rotacional de ese campo será nulo. Falta la demostración en el otro sentido: que cuando ∇ × Ū = 0̄, entonces la circulación a lo largo de cualquier camino cerrado es cero. En efecto, si ∇ × Ū = 0̄, entonces ∂U1 ∂U2 = ; ∂y ∂x ∂U1 ∂U3 = ; ∂z ∂x ∂U2 ∂U3 = ∂z ∂y (145) La trayectoria desde un punto (x0 , y0 , z0 ) a un punto (x, y, z) se puede implementar de una infinidad de formas mediante segmentos paralelos a los ejes de coordenadas. Sea una de estas trayectorias que transcurre en tres tramos, el primero paralelo al eje x, desde (x0 , y0 , z0 ) hasta (x, y0 , z0 ). El siguiente tramo será paralelo al eje y, desde (x, y0 , z0 ) a (x, y, z0 ). El último paralelo al eje z, desde (x, y, z0 ) a (x, y, z). La circulación es entonces Z C Ū · dr̄ = Z x x0 U1 (x, y0 , z0 )dx + Z y y0 U2 (x, y, z0 )dy + Z z z0 U3 (x, y, z)dz (146) Esta integral será una función de (x, y, z), que llamaremos f (x, y, z): 23 Z De aquı́: C Ū · dr̄ = f (x, y, z) (147) ∂f = U3 (x, y, z) ∂z Como z0 es constante en las otras dos integrales, tenemos: ∂f ∂y Z z ∂U3 ∂U2 dz = U2 (x, y, z0 ) + dz z0 ∂y z0 ∂z = U2 (x, y, z0 ) + U2 (x, y, z)|zz0 = U2 (x, y, z) = U2 (x, y, z0 ) + Z (148) z (149) Y de la misma forma Z y Z z ∂f ∂U2 = U1 (x, y0 , z0 ) + dy + ∂x y0 ∂x z0 Z y Z z ∂U1 = U1 (x, y0 , z0 ) + dy + y0 ∂y z0 = U1 (x, y, z) ∂U3 dz ∂x ∂U1 dz ∂z (150) En definitiva, ∂f = U1 (x, y, z); ∂x ∂f = U2 (x, y, z); ∂y ∂f = U3 (x, y, z) ∂z (151) y por tanto Ū = ∇f . Resumiendo: definimos anteriormente los campos irrotacionales como aquellos en que la circulación a lo largo de una trayectoria depende sólo de los extremos. Demostramos que si un campo Ū es irrotacional, existe una función escalar f tal que Ū = ∇f , y también que dada una función escalar f , la circulación de su gradiente a lo largo de una trayectoria cerrada es nula. A continuación hemos definido el rotacional de un campo vectorial, y hemos encontrado la forma de calcularlo haciendo ∇ × Ū . Lo que acabamos ahora de demostrar es que si ∇ × Ū = 0̄, entonces existe una función escalar tal que Ū = ∇f , luego su circulación por cualquier trayectoria cerrada es nula, luego Ū es irrotacional. Ejemplo: Dado Ū = rα r̄, demostrar que es irrotacional. Será irrotacional si su circulación a lo largo de una trayectoria depende sólo de los extremos, y eso sucederá si existe un f tal que Ū = ∇f . Busquemos esa f . De entrada 24 ∂f = rα x; ∂x ∂f = rα y; ∂y ∂f = rα z ∂z (152) Por otro lado x ∂r = ; ∂x r ∂r y = ; ∂y r ∂r z = ∂z r (153) y sustituyendo la última en la anterior: ∂f ∂r = rα+1 ; ∂x ∂x ∂f ∂r = rα+1 ; ∂y ∂y ∂f ∂r = rα+1 ∂z ∂z (154) A la vista de las ecuaciones anteriores, está claro que puede tomarse 1 α+2 r α+2 siempre que sea α 6= −2. Pero si α = −2 f= x ∂f = 2 ∂x x + y2 + z2 (155) (156) y análogamente para las otras coordenadas. Se ve entonces que puede tomarse f = log q x2 + y 2 + z 2 (157) Obsérvese lo siguiente: si hubiésemos fallado en la búsqueda de la función f , eso no demostrarı́a que el campo no es irrotacional. Por eso, desde el punto de vista lógico, parece mejor demostrar la irrotacionalidad simplemente calculando el rotacional y comprobando que es nulo, ya que, como hemos demostrado, el rotacional nulo implica campo irrotacional. 4.10 El teorema de Stokes Daremos aquı́ una demostración cualitativa. Sea una superficie cualquiera S que se apoya sobre una curva C. Si dividimos la superficie S en una multitud de pequeños circuitos adyacentes, veremos que la cada segmento de circuito compartido aparece dos veces, una con un signo y otra con otro, y que por tanto la circulación total sobre todos los circuitos se reduce a la circulación sobre C. Ahora, de la definición de rotacional, la circulación sobre cada pequeño circuito es el producto del rotacional de Ū en cada circuito (suponemos que los circuitos son muy pequeños y que podemos tomar el rotacional como el rotacional en un punto interior al circuito) por el área del 25 circuito. Al sumar para todos los circuitos, tenemos la integral de superficie del rotacional. Y esto es lo que afirma el teorema de Stokes: Z 5 C Ū · dr̄ = Z S (∇ × Ū )dS̄ (158) Bibliografı́a Estas notas han seguido grosso modo el excelente texto de Kathleen M. Urwin, ”Cálculo Superior y Teorı́a del Vector Campo”, en traducción de Elena Martı́n Peinador. También recomendamos ”Cálculo diferencial e integral”, de N. Piskunov, ed. Montaner y Simón. Ambos contienen multitud de ejemplos ilustrativos, de los que hemos tomado unos pocos. 6 Resumen conceptual 1. Integrales de camino. La integral de camino en forma paramétrica. Trabajo 2. Condición para que la integral de camino sea independiente de la trayectoria elegida. 3. Integrales dobles y cambio de variable. 4. El teorema de Green. 5. Campo escalar. Gradiente. 6. Campo vectorial. Definición de campo irrotacional. Si un campo Ū es irrotacional, entonces existe una función escalar f tal que Ū = ∇ · f . Si f es una función escalar, entonces ∇ · f es irrotacional. 7. Flujo y divergencia. Campos solenoidales. 8. Teorema de la divergencia e identidades de Green. 9. El rotacional. Si ∇ × Ū = 0̄, entonces el campo es irrotacional, y a la inversa. 10. Teorema de Stokes. 26 7 Ejercicios 1. Calcular Z (x2 + y)dx + xydy (159) a lo largo del camino AD formado por las rectas AB, BC y CD, con A = (0, 0), B = (2, 2), C = (2, 6), D = (3, 9). (Solución: 661/6) 2. Demostrar que la integral Z (y 2 + 4)dx + (2xy + 3)dy (160) es independiente del camino de integración, y calcular su valor entre A = (1, 2) y B = (3, 4). (Solución: 58) 3. Calcular ∇(f (r) + g(1/r)) (161) donde f y g son funciones arbitrarias y r2 = x2 + y 2 + z 2 . 4. Calcular la divergencia del campo vectorial f¯ = rn g(1/r)r̄ (162) 5. Si ā es un vector constante, demostrar que ∇ × (ā × r̄) = 2ā 27 (163) II Leyes básicas del electromagnetismo 1 Campos Es un hecho experimental que la materia puede modificar el espacio circundante, incluso a largas distancias, confiriéndole alguna propiedad que se manifiesta por la aparición de fuerzas. Por ejemplo, una masa crea unas condiciones tales que aparecen fuerzas sobre otras masas cercanas, o incluso muy lejanas. Como la forma de manifiestarse esta propiedad que la materia confiere al espacio es mediante fuerzas, que son vectoriales, podemos representar la alteración introducida mediante un campo vectorial Ē(x, y, z). Es también un hecho experimental que hay campos de distintas clases. Tenemos la gravedad, el campo eléctrico y el magnético, y otros campos que se manifiestan a cortas distancias. Cada campo está asociado a una propiedad distinta de la materia. Ası́, el campo de gravedad a la masa y el campo eléctrico a la carga. Nos centraremos desde este momento en el campo eléctrico. 2 Campo eléctrico Una carga q, que colocamos en el origen de un sistema de referencia, crea en la posición r̄ un campo, de forma que una carga q ′ influida por ese campo experimenta una fuerza F̄ = q ′ Ē. Se comprueba experimentalmente que el campo creado por la carga q es proporcional a la misma, inversamente proporcional al cuadrado de la distancia al punto considerado y dirigido según la recta que la une con el punto. Cuantitativamente: Ē = q r̄ 4πε0 r3 (1) En el S.I. de unidades: 1 N m2 = 9 × 109 2 4πε0 C (2) La fuerza que experimenta una carga q ′ situada en r̄ respecto a q es F̄ = qq ′ r̄ 4πε0 r3 (3) Vemos que cuando qq ′ > 0 la fuerza es repulsiva, y que cuando qq ′ < 0 es atractiva. 28 Otro hecho experimental es que los campos debidos a varias cargas se suman vectorialmente, de modo que, dada una serie de cargas qi en posiciones r̄i , el campo creado en un punto r̄ viene dado por Ē(r̄) = qi (r̄ − r̄i ) 4πε0 |r̄ − r̄i |3 X i (4) Si en lugar de un conjunto de cargas puntuales tenemos una distribución continua, entonces calcularemos el campo como una integral sobre la distribución continua, descrita por la densidad lineal, superficial o volúmica de carga. Ejemplo: Dada una distribución lineal continua de longitud infinita a lo largo del eje z y densidad lineal λ, calcular el campo en un punto del eje x a distancia d del eje z. Solución: un elemento de carga situado en la coordenada z y de longitud dz contiene una carga λdz, y crea un campo dĒ = λdzr̄ 4πε0 r3 (5) con r3 = (d2 + z 2 )3/2 y r̄ = (d, 0, −z). Por tanto, no hay campo en la dirección y. En la dirección x: dEx = λd dz 2 4πε0 (d + z 2 )3/2 (6) y λ dz λd Z ∞ = Ex = 4πε0 −∞ (d2 + z 2 )3/2 2πε0 d (7) Por simetrı́a, ya se ve que Ez = 0, pero se puede comprobar por integración. 2.1 Propiedades del campo eléctrico El campo creado por una carga q en r̄ (tomándola como origen) es: q r̄ (8) 4πε0 r3 Este campo es irrotacional. Para verlo podemos aplicar I.153 y siguientes, o bien calcular directamente: Ē = ∇ × Ē = 1 ∇(r−3 ) × r̄ + r−3 ∇ × r̄ 4πε0 29 (9) Pero ∇ × r̄ = 0 y ∇r−3 = −3r−5 r̄, de donde se sigue ∇ × Ē = 0̄. Demostramos en I.4.9 que si ∇ × Ū = 0̄ entonces Ū es irrotacional, es decir, existe una función escalar f tal que Ū = ∇f . En nuestro caso, tomando I.156 con α = −3: f =− q 1 4πε0 r (10) Por otra parte, en I.114 vimos que para Ū = f (r)r̄, la divergencia es ∇ · Ū = rf ′ (r) + 3f (r) (11) ∇2 f = 0 (12) que en nuestro caso da ∇ · Ē = 0. Pero como E = ∇f , se sigue que el potencial satisface la ecuación de Laplace: Nota: aunque no hay razón matemática para ello, en Fı́sica se suele tomar el potencial de forma que el campo sea no el gradiente del potencial, sino menos dicho gradiente: Ū = −∇f . De acuerdo con ello, y para no introducir divergencias que hagan molesta la comparación de estas notas con los textos habituales, adoptamos aquı́ también esa convención, y en consecuencia el potencial lo tomamos no como fue definido en (10), sino como f= 2.2 1 q 4πε0 r (13) Regiones que contienen cargas Los razonamientos anteriores presuponen que el campo se puede calcular en todo punto, pero precisamente en r = 0 existe una singularidad, de manera que los resultados anteriores serán válidos para regiones libres de cargas, en que el campo se puede calcular y por tanto su divergencia y rotacional, pero no para regiones que contienen cargas, pues en los puntos ocupados por esas cargas el campo es singular. Consideremos una carga q situada en el origen, y una esfera de radio a centrada en el mismo. Calculamos el flujo a través de la esfera: 1 q q Z q ā · d S̄ = (14) r̂ · r̂dS = 3 2 4πε0 a S ε0 S 4πε0 a Esto significa que una carga positiva se comporta como una fuente de lı́neas de campo, y una carga negativa como un sumidero. Si ahora consideramos que tenemos no una carga puntual sino una distribución continua de densidad ρ en un pequeño volumen ∆v, entonces Z 30 ρ 1 Z (15) Ē · dS̄ = ∆v S ε0 pero la parte de la izquierda es precisamente la definición de la divergencia, luego ∇ · Ē = ρ ε0 (16) Además, como Ē = ∇f , ρ ε0 que es conocida como ecuación de Poisson. La expresión ∇2 f = (17) Z (18) S Ē · dS̄ es útil en algunos casos en que se dan simetrı́as evidentes. Por ejemplo, calculamos el campo a una distancia d de un hilo infinito de densidad lineal de carga λ. Por simetrı́a, el campo ha de ser radial y valer lo mismo en todo punto de un cilindro de radio d cuyo eje coincida con la distribución de carga. Tomando la superficie de un cilindro de altura h y radio d cuyo eje coincida con el de la distribución, al ser el campo radial no existe flujo más que a través de la superficie curva del cilindro, de manera que Z S Ē · dS̄ = 2πdhE = λh ε0 (19) y de aquı́ λ (20) 2πε0 d que coincide con (7), pero que hemos obtenido de forma mucho más directa. E= 2.3 El campo eléctrico en la materia Es un hecho experimental que la materia está constituida por partı́culas cargadas, de carga positiva y negativa (y también de partı́culas sin carga, que no juegan papel en nuestra discusión). Cuando una substancia se expone a un campo, las partı́culas cargadas de la substancia experimentan fuerzas que son de un sentido u otro según la carga positiva o negativa, y como consecuencia aparece una cierta separación de carga: las cargas positivas tienden a desplazarse en un sentido y las negativas en otro opuesto. Aparece 31 entonces un campo interno debido a esta separación que se superpone con el campo exterior aplicado, dando lugar a un campo neto: Ē = Ēext + Ēint (21) La magnitud y dirección del campo interno depende de cada substancia en particular, ası́ como de su forma geométrica. Hay dos situaciones que pueden presentarse, según que las partı́culas cargadas en el interior de la substancia se encuentren libres o no. A las substancias del primer tipo se las llama ”conductores”; a las del segundo, ”dieléctricos”. A) Conductores. Puesto que en los conductores las cargas se pueden mover libremente, una situación de equilibrio implica la no existencia de corrientes, luego el campo en el interior es nulo, luego, aplicado un campo externo, las cargas libres se reorganizan sobre la superficie del conductor, dando lugar a un campo Ēint que superpuesto al campo aplicado dan un campo total nulo. Otra forma de expresar esto es diciendo que en el interior del conductor el potencial es constante. Es posible usar el mismo razonamiento que conduce a (20) para encontrar el campo en puntos próximos a la superficie del conductor. Para ello consideramos un cilindro cerrado cuya base es paralela a la superficie y se encuentran justo bajo la misma. El otro extremo del cilindro se encuentra justo sobre la superficie. La altura del cilindro es muy pequeña. Ahora bien, el campo ha de ser perpendicular a la superficie. Si no lo fuera, existirı́a una componente tangencial y habrı́a corrientes superficiales, en contra de la hipótesis de equilibrio. Por tanto, el flujo que atraviese el cilindro ha de pasar a través de las dos circunferencias. Pero el flujo a través de la base es nulo, porque el campo en el interior el conductor es nulo, ası́ que sólo queda el flujo a través de la parte superior. Por tanto: E∆S = σ∆S ε0 (22) es decir: Ē = σ n̂ ε0 (23) Puede dar la impresión de que Ē es debido sólo a la densidad σ, pero esto no es ası́: Ē es debido al sistema total de cargas, a consecuencia del cual hay en el punto considerado una densidad superficial; de hecho, en nuestro razonamiento hemos considerado que el flujo en la cara inferior es nulo, aunque el debido sólo a la carga superficial no lo es. Entonces, hemos 32 considerado el campo total. Y sin embargo, este campo total se expresa en función sólo de la carga superficial. Esta es una propiedad muy notable. Al considerar ahora el campo externo Ēext , un elemento ∆S de superficie se verá sometido a una fuerza F̄S = σ∆S Ēext (24) ¿Cuánto vale Ēext ? En el razonamiento anterior calculamos el campo total. Pero si calculamos el campo debido sólo a la densidad superficial σ, entonces hemos de considerar el flujo a través de las dos caras del cilindro, y obtenemos un campo que es exactamente la mitad. Por tanto, si conocemos el campo debido a la carga superficial y el campo total, y el primero es la mitad del segundo, está claro que el campo exterior serı́a la otra mitad del campo total: 1σ n̂ (25) 2 ε0 y la fuerza sobre la unidad de superficie se calcula entonces fácilmente como Ēext = 1 σ2 1 F̄S = n̂ = ε0 E 2 n̂ f¯S = ∆S 2 ε0 2 (26) B) Dieléctricos. En los dieléctricos, la movilidad de las cargas es limitada, y por tanto la separación inducida por un campo externo también lo es. Aunque en lo posible queremos mantenernos en el campo macroscópico, consideraremos en relación con los dieléctricos en primer lugar un modelo de dipolo. Un dipolo es un conjunto de dos cargas de signo opuesto y valor q separadas por una distancia l. Colocamos la carga negativa en el origen del sistema de referencia, y la carga positiva sobre el eje y, a distancia l del origen. Como el problema tiene simetrı́a axial nos podemos limitar a calcular el campo creado por el dipolo en un punto P = (x, y) del plano. El potencial creado por el conjunto de las dos cargas es f= 1 q(r− − r+ ) 4πε0 r− r+ (27) donde r̄− = (x, y) y r̄+ = (x, y − l). Es una pura cuestión algebraica escribir los módulo de ambos vectores, sustituirlos en la ecuación del potencial y obtener ası́ f (x, y), y a partir de ahı́ el campo eléctrico creado por el dipolo Ē(x, y). En el proceso, que vamos a omitir aquı́, se puede suponer que P es un punto muy alejado del dipolo, de tal forma que r+ , r− >> l. También, 33 dada la simetrı́a del problema, se puede introducir el ángulo θ que forma la dirección desde el origen del punto P con el eje y. El resultado de los cálculos es que 1 p cos θ 1 p̄ · r̄ = (28) 2 4πε0 r 4πε0 r3 donde p̄ es un vector de módulo ql y que va desde la carga negativa a la positiva. Las proyecciones del campo eléctrico Ē = −∇f sobre la dirección radial y la dirección perpendicular a la misma son f= 1 2p cos θ 4πε0 r3 1 p sin θ = 4πε0 r3 Er = Eθ (29) Se ve que cuando un dipolo se introduce en un campo uniforme, la fuerza que actúa sobre él es F̄ = q Ē − q Ē = 0̄ (30) F̄ = q(Ē+ − Ē− ) (31) Sólo cuando el dipolo está sometido a un campo no uniforme, de manera que la fuerza sobre cada carga es distinta, existe una fuerza neta sobre el dipolo: Por otro lado, el trabajo realizado por el campo para llevar a una carga q desde la posición 1 a la posición 2 es Z 2 1 q Ē · dr̄ = −q Z 1 2 (∇f ) · dr̄ = q(f1 − f2 ) (32) Si se toma convencionalmente el punto final como ∞, al trabajo realizado se le llama ”energı́a potencial”. Véase que f (r = ∞) = 0, ası́ que la energı́a potencial de una carga en un punto r es W = qf (r). La energı́a potencial del dipolo es entonces W = q(f+ − f− ) (33) W = q(∇f )l · ˆl = −qlˆl · Ē = −p̄ · Ē (34) pero f+ − f− es la variación de f al movernos en la dirección del vector p̄ una distancia l. El cambio en una función escalar al movernos en una dirección dada quedó establecido en la fórmula I.75, de forma que: 34 La idea subyacente a la discusión anterior es que en un dieléctrico sometido a un campo, las cargas positivas y negativas de las moléculas se separan un poco (no mucho, porque las cargas no son libres y porque el campo interno de las moléculas es mucho más intenso que el campo externo) y se comportan como dipolos. Si las distribuciones de densidad de cargas positivas y negativas, ρ+ y ρ− son constantes, la separación conducirá a cargas sin compensar sólo en la superficie del dieléctrico. Si las densidades no son constantes, entonces aparecerán cargas sin compensar en todo el volumen. Estas separaciones microscópicas nos permiten definir un vector polarización por unidad de volumen de la siguiente forma: aislamos mentalmente un pequeño volumen ∆v, calculamos la suma vectorial de todos los momentos dipolares p̄i de cada molécula y dividimos por el volumen. Ası́, se define el momento dipolar por unidad de volumen como P̄ = 1 X p̄i ∆v i (35) Se ha comprobado experimentalmente para un gran número de dieléctricos que la polarización varı́a linealmente con el campo aplicado. Se escribe: P̄ = χε0 Ē (36) donde a χ se le llama ”susceptibilidad dieléctrica”, y es siempre mayor que cero. 2.4 Propiedad del vector P̄ Como hemos dicho, en un dieléctrico existen densidades de cargas positivas y negativas, ρ+ y ρ− , y cuando se aplica un campo externo, se produce una separación entre ambas. Si estas densidades no son constantes, en cada punto resultará un exceso de densidad de carga ρ′ = ρ+ − ρ− . Pues bien, el vector P̄ cumple la siguiente importante propiedad: ∇ · P̄ = −ρ′ (37) Demostración: Sea un elemento de volumen del dieléctrico limitado por una superficie S, y sea dS un elemento de dicha superficie. Al aplicar el campo, que suponemos dirigido en una dirección cualquiera hacia el exterior del volumen, la carga positiva experimenta un desplazamiento l+ y la negativa un desplazamiento l− . Si α es el ángulo que forma el campo aplicado y por tanto el desplazamiento con la normal a la superficie, en dirección saliente atraviesa ésta una cantidad de carga ρ′+ l+ cos αdS, y en dirección entrante ρ′− l− cos αdS. Pero el movimiento de una cantidad de carga negativa hacia el 35 interior del volumen equivale a un desplazamiento de una igual cantidad de carga positiva en sentido contrario, ası́ que se puede poner como flujo total: ρ′+ (l+ + l− ) cos αdS y esto se puede poner como P̄ · dS̄. La cantidad de carga que abandona S se obtiene integrando a todo el volumen, y debe ser igual al exceso de carga en el interior del volumen, con signo contrario, de manera que Z S P̄ · dS̄ = − Z V ρ′ dV = −q ′ (38) y aplicando el teorema de la divergencia, se tiene en forma diferencial ∇ · P̄ = −ρ′ (39) Todavı́a hay una relación entre el exceso de carga ρ′ inducida por el campo aplicado y la densidad de carga ρ de otro tipo que pueda estar presente. En efecto, para dieléctricos homogéneos se cumple (36), es decir χ Z S ε0 Ē · dS̄ = −q ′ (40) pero la integral es justamente la carga total contenida en el volumen encerrado por S, como muestra (16), luego χ(q + q ′ ) = −q ′ ; 2.5 q′ = − χ q 1+χ (41) El vector D̄ De vuelta a (16), pero distinguiendo la carga total entre carga de exceso por polarización y ”otras cargas”, escribimos: Z S ε0 Ē · dS̄ = q + q ′ (42) El problema con esta expresión es que q ′ depende de Ē pero a su vez Ē depende de q ′ . Sin embargo, como q ′ se puede escribir en función de P̄ : Z S (ε0 Ē + P̄ )dS̄ = q (43) Introducimos el vector auxiliar D̄ y escribimos, en forma diferencial, ∇ · D̄ = ρ (44) Para un dieléctrico homogéneo: D̄ = ε0 Ē + P̄ = ε0 Ē + χε0 Ē = ε0 εĒ 36 (45) con ε = 1 + χ. Un comentario pertinente a propósito de (44) es que dicha ecuación nos indica que las fuentes de D̄ son sólo las cargas distintas de las de polarización. Luego las lı́neas del campo D̄ tienen sus fuentes y sumideros en las cargas distintas de las de polarización. Ahora bien, esto no significa que el campo D̄ esté determinado sólo por este tipo de cargas: está determinado por todas las cargas, al igual que Ē, con el que está relacionado por (45). (44) expresa una propiedad de D̄, pero no dice cómo calcularlo. 2.6 Condiciones de contorno Supongamos dos dieléctricos 1 y 2 separados por una interfaz donde, para mayor generalidad, admitimos la existencia de una densidad de cargas libres σ. Las propiedades de Ē y D̄: Z Z C Ē · d¯l = 0 (46) S D̄ · dS̄ = q (47) nos permiten encontrar condiciones que cumplen ambos al pasar del medio 1 al 2. Apliquemos la primera considerando un pequeño circuito rectangular que comienza con un primer tramo d¯l1 en el medio 1, paralelo a la superficie; después, cruza la superficie y hace el camino de vuelta por el otro lado, recorriendo un d¯l2 = −d¯l1 . Finalmente, cruza de nuevo la superficie de separación y vuelve al punto de partida. Si los tramos donde se cruza la interfaz son despreciables frente a los que van paralelos a ella, y si estos son a su vez tan pequeños que a lo largo de los mismos el campo se puede considerar constante, es claro que la circulación de Ē en ese circuito se puede escribir: Ē1 · d¯l1 + Ē2 · d¯l2 = 0 (48) (Ē1 − Ē2 ) · d¯l1 = 0 (49) o Es decir, que las proyecciones de Ē tangenciales a la superficie de separación son iguales a ambos lados: E1t = E2t (50) En general, las componentes normales no serán iguales, ya que el mismo campo aplicado crea polarizaciones distintas en 1 y 2 y por tanto campos de 37 polarización distintos que se superponen al campo aplicado para dar campos totales distintos. En cuando a D̄, tomando un cilindro de altura despreciables y caras paralelas a la interfaz, con una a cada lado, la ecuación (47) nos dice que ¯ 1 + D̄2 · ∆S ¯ 2 = σ∆S D̄1 · ∆S (51) (D̄1 − D̄2 ) · n̂∆S = σ∆S (52) ¯ 2 = −∆S ¯ 1: o, como ∆S y se sigue que las componentes normales de D̄ cumplen: D1n − D2n = σ (53) Una consecuencia de esto es que las lı́neas del campo eléctrico Ē sufren una refracción al pasar de un dieléctrico a otro. En efecto, si α1 es el ángulo que forma Ē con la normal a la superficie por el lado del dieléctrico 1 y α2 el ángulo por el lado del dieléctrico 2, teniendo en cuenta que D̄ = ε0 εĒ, poniendo D̄1 = ε1 Ē1 y D̄2 = ε2 Ē2 , y teniendo en cuenta también que en ausencia de cargas libres D1n = D2n : E1t E1n con expresión similar para α2 , de donde tan α1 = (54) ε1 tan α1 = (55) tan α2 ε2 Por otro lado, si la interfaz separa un conductor de un dieléctrico, sabemos que el campo Ē en el interior del conductor es nulo, y por tanto también lo es D̄. Si el medio 2 es el conductor, la ecuación (53) nos dice que Dn = σ. Finalmente, consideremos el caso en que se ponen en contacto un conductor cargado con una carga superficial σ con un dieléctrico. Si el dieléctrico es homogéneo, aparecerá una carga de polarización superficial σ ′ . De q (56) ε0 S tomando un pequeño cilindro de altura despreciable y caras paralelas a la interfaz, una a cada lado, se sigue: Z Ē · dS̄ = En = σ + σ′ ε0 y como al mismo tiempo 38 (57) En = Dn εε0 (58) combinando ambas: ε−1 σ (59) ε y esto nos dice que hay una relación definida entre la densidad de cargas de polarización y la densidad de cargas libres. Este resultado tiene más importancia de la que parece. Veamos por qué. Hemos dicho que el campo total Ē en el interior de un dieléctrico es difı́cil de calcular, porque depende de las cargas de polarización, que a su vez dependen del campo que hay que calcular. También hemos dicho que cuando las densidades de carga ρ+ y ρ− en un dieléctrico son constantes, entonces el exceso de carga de polarización aparece sólo en la superficie del dieléctrico. Pues bien: consideremos la situación en que tenemos una serie de conductores cargados en el espacio vacı́o que crean un campo Ē0 . Cuando ese espacio se rellena completamente con un dieléctrico homogéneo, en las superficies de contacto entre conductores y dieléctrico aparecen cargas superficiales σ ′ , de tal forma que la densidad superficial en cada punto pasa de σ a σ + σ ′ = σ/ε. Como esta relación es válida en cada punto de cada superficie, quiere decir que no se altera la configuración de Ē0 , sino sólo su magnitud: σ′ = − 1 Ē = Ē0 (60) ε Multiplicando por εε0 ambos lados, se sigue que D̄ = D̄0 . Además, podemos calcular el campo de polarización. Combinando Ē = Ē ′ + Ē0 , que P̄ = χε0 Ē y que Ē0 = εĒ, se sigue que Ē ′ = 1−ε 1 P̄ = − P̄ χε0 ε0 (61) Además, como el campo se reduce por la introducción del dieléctrico (Ē = Ē0 /ε), y dicho campo deriva de un potencial f , se sigue también que f = f0 /ε, e igualmente para las diferencias de potencial. 2.7 Energı́a del campo eléctrico Consideremos dos cargas iguales aisladas interaccionando sólo entre ellas. Como consecuencia de las fuerzas mutuas que ejercen la una sobre la otra sufren desplazamientos dr̄1 y dr̄2 , luego se realiza un trabajo 39 δA = F̄1 · dr̄1 + F̄2 · dr̄2 = F̄1 dr̄ (62) donde r̄ = r̄1 − r̄2 es la posición relativa de la carga 1 en un sistema fijo en la carga 2. Por tanto: el trabajo realizado por las dos fuerzas de interacción entre dos cargas es igual al realizado por la fuerza que actúa sobre una de las cargas en un sistema de referencia fijo en la otra. Como la fuerza eléctrica deriva de un potencial f : δA12 = −dW12 (63) donde W12 depende sólo de la distancia entre las cargas 1 y 2. Este resultado se puede generalizar a un conjunto arbitrario de cargas. Por ejemplo, para tres cargas: W = W12 + W13 + W23 (64) que se puede poner como 1 1 1 W = (W12 + W21 ) + (W13 + W31 ) + (W23 + W32 ) 2 2 2 que se puede reorganizar ası́: 1 1 1 W = (W12 + W13 ) + (W21 + W23 ) + (W31 + W32 ) 2 2 2 y finalmente escribir como W = 1X Wi 2 i (65) (66) (67) donde Wi es la energı́a de interacción de la carga i con el resto de cargas. Es obvio que este razonamiento no depende de que sea i = 3 y por tanto es válido para cualquier número de cargas. Como, además, Wi = qi fi , ecuación (32), queda finalmente W = 1X qi f i 2 i (68) donde fi es el potencial creado en la posición de qi por el resto de cargas. Ejemplo: encontrar la energı́a de interacción de un sistema de cuatro cargas iguales q situadas en los vértices de un tetraedro regular de lado a. Solución: sobre cada carga actúan las otras tres, creando un potencial conjunto que es tres veces el que crearı́a una sola, ya que están las tres a la misma distancia de la cuarta. Este potencial conjunto es 40 1 3q 4πε0 a La energı́a total de interacción será (69) 1 3q 2 1 6q 2 ×4× = 2 4πε0 a 4πε0 a En el caso de una distribución continua de carga, la energı́a es (70) 1Z W = ρf dV (71) 2 V Sin embargo, se ha de tener presente que esta expresión difiere cualitativamente de la expresión para el caso discreto. Y es que, dados dos cuerpos continuos cargados, W no es simplemente la energı́a de interacción entre ellos, porque para cada carga elemental ρdV de un cuerpo es preciso considerar el potencial de todos los elementos del otro cuerpo, pero también el potencial de todos los elementos del mismo cuerpo. Es decir, que para un cuerpo cargado aislado, todavı́a será W 6= 0 debido a la interacción entre sus propias partes. La ecuación (71) puede ponerse en una forma interesante. En efecto 1Z 1Z ρf dV = (∇ · D̄)f dV (72) W = 2 V 2 V pero (∇ · D̄)f = ∇ · (f D̄) + Ē · D̄. Transformamos ahora la integral de volumen del primer término del segundo miembro: Z V ∇ · (f D̄)dV = Z S f D̄ · dS̄ (73) S puede ser cualquier superficie arbitraria con tal de que encierre al sistema de cargas. Si hacemos esa superficie más y más grande, ella crece como r2 , pero f D decrece como r−3 , ası́ que la primera integral tiende a cero y sólo queda la segunda, pudiendo escribirse 1Z Ē · D̄dV 2 V que es una expresión que contiene sólo los campos, no las cargas. W = 2.8 (74) Corriente Cuando se aplica un campo a un conductor, se produce movimiento en las cargas. La carga puede ser transportada por electrones o iones, en conductores metálicos, electrolitos, etc. Aquı́ nos restringimos al movimiento de electrones en conductores metálicos. Si S es una superficie cualquiera en el 41 interior de un conductor al que se aplica un campo, se define la intensidad a través de esa superficie como la carga que la atraviesa por unidad de tiempo: dq (75) dt Esta carga que atraviesa S en la unidad de tiempo depende de dos factores: de la densidad de carga ρ y de la velocidad media ū a la que se muevan las cargas. Se define entonces el vector densidad de corriente como i= j̄ = ρū (76) El flujo a través de S en términos de j̄ se puede poner entonces como dq (77) dt S donde el signo ’-’ proviene de que la normal a S, si es una superficie cerrada, se toma convencionalmente hacia afuera. Entonces, el flujo de j̄ es la carga que abandona el volumen encerrado por S. Aplicando el teorema de la divergencia podemos escribir la ley diferencial para la densidad de corriente: i= Z j̄ · dS̄ = − ∂ρ (78) ∂t que se conoce como ”ecuación de continuidad”. La ley de Ohm es un resultado experimental que afirma que, cuando se establece una diferencia de potencial U entre los extremos de un conductor, la intensidad que circula es ∇ · j̄ = − i = U/R (79) donde R es una constante que depende tanto del material conductor como de su geometrı́a. Por ejemplo, cuando el conductor tiene forma de cable de longitud l y sección s: l (80) s A la constante ρ se le llama resistividad, y depende del material conductor y de su temperatura 1 . R=ρ 1 Usamos la misma letra, ρ con la que nos hemos referido a la densidad de carga, primero porque la resistividad se ha designado tradicionalmente con esta letra, y segundo porque con este significado sólo la empleamos en esta parte y en un contexto en que no hay peligro de confusión con otras partes del texto en que representa una densidad de carga. 42 Si aislamos mentalmente un cilindro de sección dS y longitud d¯l cuyo eje es paralelo a j̄ y a Ē, combinando las dos ecuaciones anteriores: dl (81) dS y simplificando queda j = σE, donde a σ = 1/ρ se le llama ”conductividad” 2 . En forma vectorial: jdS = Edl/ρ j̄ = σ Ē (82) Esta es conocida como ”forma diferencial” de la ley de Ohm, no porque contenga diferenciales, sino porque es local: válida para cada punto del conductor. Ahora bien, es evidente que las fuerzas electrostáticas por sı́ mismas sólo pueden dar lugar a una corriente transitoria, ya que la energı́a de cualquier sistema de cargas es una cantidad limitada al valor dado por (68). Por tanto, es preciso que existan otras fuerzas de naturaleza distinta que llamaremos Ē ⋆ . Entonces, reescribimos (82) como j̄ = σ(Ē + Ē ⋆ ) (83) Podemos integrar esta expresión entre dos puntos de un conductor rectilı́neo. Si el conductor es delgado, podemos considerar a j̄ paralelo a d¯l: Z 2 j̄ ¯ Z 2 · dl = Ē · d¯l + Ē ⋆ · d¯l (84) 1 σ 1 1 Pero la primera integral es Ri mientras que el primer término del segundo miembro es f2 − f1 . Al segundo término del segundo miembro le llamamos ”fuerza electro-motriz”, o abreviadamente ”fem”, designándola mediante E: Z 2 E12 = Z 2 1 Ē ⋆ · d¯l (85) Ası́ que tenemos la generalización de la ley de Ohm: Ri = f1 − f2 + E12 (86) Esta es la ecuación básica que permite resolver circuitos de corriente continua. En particular, las reglas de Kirchoff permiten plantear un sistema de ecuaciones en las intensidades que circulan por las diferentes ramas de un circuito. No entraremos en esta materia. 2 Vale la misma observación para σ que hemos hecho en la nota anterior para ρ. 43 3 Campo magnético Desde antiguo son conocidos los imanes y las substancias magnéticas, y el hecho de que aparecen fuerzas entre ellas o entre ellas y algunos metales. Más recientemente se descubrió la interacción entre los imanes y las corrientes eléctricas, o entre corrientes eléctricas. Todos estos experimentos permitieron formular la existencia de un tipo de interacción distinta a la electrostática y que actúa también sobre las cargas. Aunque la razón profunda de estas interacciones es relativista, las propiedades del campo magnético son conocidas con anterioridad a la formulación de la teorı́a de la relatividad, a partir de experimentos, ası́ que podemos partir de estos experimentos en la exposición que sigue. 3.1 Fuerza de Lorentz Se comprueba que existe una fuerza que afecta a las cargas en movimiento, de forma que la fuerza total sobre una carga podrá descomponerse en una parte eléctrica y una parte magnética. Esta ley de fuerza es F̄ = q[Ē + v̄ × B̄] (87) y como puede verse: a) depende de la velocidad y b) es perpendicular a la misma, lo cual significa que el campo magnético, que representaremos por B̄, no realiza trabajo sobre la carga. Pero la velocidad v̄ dependerá del sistema de referencia en que se mida, ası́ que distintos sistemas de referencia medirán distintos valores de la fuerza magnética. La otra parte de la cuestión es que cargas en movimiento crean campos magnéticos. Es decir: una carga en movimiento crea un campo magnético, que ella misma no experimenta, y a su vez una carga que se mueve en un campo magnético, creado por otras cargas en movimiento, experimenta una fuerza. El campo magnético creado por una carga en un punto r̄ es µ0 q v̄ × r̄ (88) 4π r3 Esto significa que el campo magnético decrece con el cuadrado de la distancia, y que es siempre perpendicular al plano en que se mueve la carga. En el S.I. de unidades: B̄ = µ0 = 10−7 H/m (89) 4π A B̄ se le llama ”inducción magnética” y se mide en Teslas. Recordando la ley de Coulomb (1): 44 B̄ = µ0 ε0 [v̄ × Ē] (90) y como µ0 ε0 es una cantidad muy pequeña, se ve que a velocidades ordinarias B << E. La razón por la cual el campo magnético se hace evidente es porque en general la materia es eléctricamente neutra, de forma que, aunque pequeña, la fuerza magnética es la única relevante en muchas situaciones. 3.2 Ley de Biot-Savart Al igual que el campo eléctrico, el campo magnético obedece al principio de superposición: la inducción magnética B̄ creada por un conjunto de cargas en un punto es igual a la suma vectorial de las inducciones creadas por cada una de ellas: B̄ = X B̄i (91) i y como una corriente es un conjunto de cargas que se pueden suponer moviéndose a la misma velocidad y en la misma dirección 3 , esto permite encontrar el campo creado por elementos de corriente, y, por integración, la inducción creada por corrientes finitas. A partir de la ley fundamental (88), si consideramos un elemento de volumen dV que contiene una carga dq = ρdV , la cual se mueve a velocidad v̄: µ0 j̄ × r̄ dV (92) 4π r3 donde j̄ es la densidad de corriente. Particularizando a un hilo delgado de sección dS cuyo vector tangente d¯l tiene la misma dirección que la velocidad de las cargas, tenemos que j̄dV = id¯l, de manera que también: B̄ = µ0 i d¯l × r̄ (93) 4π r3 Ejemplo: un hilo de longitud infinita que coincide con el eje z transporta una intensidad i. Calcular la inducción magnética a una distancia b sobre el eje x. Solución: el vector de posición que va desde un elemento de corriente situado en z al punto del eje x de coordenada b es r̄ = (b, 0, −z), con r3 = (b2 + z 2 )3/2 . El elemento de corriente es d¯l = (0, 0, dz), de forma que d¯l × r̄ = (0, bdz, 0). Quiere decir que la inducción magnética tiene la dirección del eje y, y valor: B̄ = 3 Más bien, a las que se puede atribuir una velocidad media, pero no queremos entrar en estos detalles del transporte. 45 µ0 i bdz 2 4π (b + z 2 )3/2 dBy = (94) El campo total se encuentra integrando para z desde −∞ a ∞: µ0 i (95) 2πb Ejemplo: una espira circular de radio a se encuentra sobre el plano xy, con su centro en el origen de coordenadas. Encontrar la inducción magnética en un punto del eje z situado a distancia b. Solución: sea un pequeño elemento genérico de la espira, y sea θ el ángulo que forma su vector posición con el eje x. Entonces, el vector que va desde este elemento de corriente al punto b del eje z es r̄ = (−a cos θ, −a sin θ, b). Por otro lado, d¯l = adθ(− sin θ, cos θ, 0), de forma que d¯l × r̄ = adθ(b cos θ, b sin θ, a). Al integrar para z desde 0 a 2π, las componentes en x e y se anulan, y sólo queda componente z. La inducción total se encuentra integrando en θ, y resulta: By = µ0 i a2 2 (a2 + b2 )3/2 Bz = 3.3 (96) Propiedades de la inducción magnética Al calcular la divergencia de B̄, tenemos 1 1 v̄ × r̄ = ∇ 3 · (v̄ × r̄) + 3 ∇ · (v̄ × r̄) ∇· (97) 3 r r r pero por cálculo directo se ve que el resultado es nulo, de manera que ∇ · B̄ = 0 (98) Integrando esta expresión para un volumen V limitado por una superficie cerrada S y aplicando el teorema de la divergencia: Z S B̄ · dS̄ = 0 (99) Esto quiere decir que el flujo que atraviesa cualquier superficie cerrada es nulo, lo cual quiere decir que el flujo entrante es igual siempre al flujo saliente, lo cual quiere decir que no existen ni sumideros ni fuentes de lı́neas de campo magnético; finalmente, eso quiere decir que no existen cargas magnéticas. La otra propiedad importante de la inducción magnética es conocida como Ley de Ampere, y establece que la circulación de B̄ en un circuito sobre el que se apoya una superficie a través de la que existe un flujo de corriente, es: 46 Z C B̄ · d¯l = µ0 X Ii (100) i donde las Ii son las intensidades que atraviesan la superficie, tomadas como cantidades algebraicas, es decir, positivas si la dirección de la corriente es congruente con la regla de la mano derecha (el sentido de giro es el de la circulación) y negativas en caso contrario. Para la deducción, algo farragosa, de esta ley, remitimos a la bibliografı́a, y aquı́ la podemos tomar como la generalización de resultados experimentales. Este resultado es especialmente útil en algunos casos en que se presentan fuertes simetrı́as. Ejemplo: inducción magnética a una distancia b de un hilo infinito. Solución: por simetrı́a, sabemos que las lı́neas de campo son tangentes a circunferencias centradas en el hilo. Tomando como circuito una circunferencia de radio b: 2πbB = µ0 i (101) de donde B= µ0 i 2πb (102) de acuerdo con (95). Ejemplo: inducción magnética en el eje de una bobina. Solución: la simetrı́a del problema nos indica que B̄ será paralelo al eje. Tomando un circuito rectangular uno de cuyos lados de longitud l se encuentre sobre el eje, y tomando el paralelo a éste fuera de la bobina y muy alejado, para que allı́ el campo se pueda considerar nulo, como la circulación en los tramos perpendiculares es nula: Bl = µ0 N i (103) donde N es el número de vueltas de espira en la longitud l. Por tanto N i = µ0 ni (104) l donde n es el número de vueltas por unidad de longitud. No obstante ser útil, la aplicación de este resultado está limitada a unos pocos casos, aunque éstos sean de interés. Véase cómo no es útil en un caso tan simétrico como el de la espira simple. B = µ0 47 La ley de Ampére puede ponerse en forma diferencial recordando que de donde Z B̄ · d¯l = Z S (∇ × B̄) · dS̄ = µ0 Z S j̄ · dS̄ ∇ × B̄ = µ0 j̄ 3.4 (105) (106) Fuerza y pares sobre conductores A partir de la fuerza de Lorentz, podemos encontrar la fuerza sobre un elemento de corriente, y a partir de ahı́, por integración, la fuerza y el par sobre un elemento finito. En efecto, aislando un elemento de volumen dV que contiene una densidad de carga ρ que se mueve con velocidad v̄: dF̄ = ρ(v̄ × B̄)dV = (j̄ × B̄)dV (107) dF̄ = i(d¯l × B̄) (108) Pero para un elemento lineal de corriente, j̄dV = id¯l, de manera que Ejemplo: fuerza por unidad de longitud entre dos hilos paralelos separados una distancia b, por los que circulan intensidades ii e i2 . Solución: calculamos la fuerza sobre el hilo que conduce i2 . El campo creado por i1 sobre un elemento en el hilo 2 situado a distancia b es el que da (95): B= µ 0 i1 2πb (109) Entonces dF µ 0 i1 i2 = (110) dl 2πb donde hemos tenido en cuenta que B̄ es perpendicular al hilo. En cuanto al momento: M̄ = Z C (r̄ × dF̄ ) (111) El desarrollo de esta expresión es algo farragoso, y lo omitimos, pero damos el resultado: M̄ = p̄m × B̄ donde p̄m es el momento magnético del elemento, definido como 48 (112) p̄m = i 3.5 Z dS̄ (113) Magnetismo en la materia Al igual que las moléculas tienen momento dipolar eléctrico intrı́nseco, también tienen momento magnético intrı́nseco (se puede pensar en los electrones como pequeñas espiras de corriente alrededor del núcleo). En cada punto del material, se define un vector magnetización J¯ como el momento magnético por unidad de volumen: 1 X J¯ = p̄m,i ∆V i (114) Si no existe una dirección preferente, los momentos individuales se compensan unos con otros. Cuando existe una dirección preferente, el material muestra magnetización. Esta magnetización es la misma que producirı́a una distribución de corrientes. En un material homogéneo, perfectamente magnetizado en una dirección, el sistema de corrientes forma circuitos, todos girando en el mismo sentido, de forma que, en cualquier punto interior al material, cada circuito se compensa con los circuitos adyacentes. Queda sin compensar solamente una corriente superficial. En un material no homogéneo quedan sin compensar corrientes en el interior del material. Si implementásemos en el vacı́o estas corrientes, el resultado serı́a equivalente al producido por el momento magnético intrı́nseco. Lo que ocurre es que a su vez estas corrientes dependen del vector B̄, ası́ que el cálculo de B̄ en el interior del volumen no es directo: para conocer el campo necesitamos las corrientes, pero éstas dependen del campo, que es desconocido. Llamaremos j̄ ′ a estas corrientes equivalentes. 3.6 Circulación del vector J¯ Consideremos una superficie cualquiera S y su contorno C en el seno de un material magnético. Acudiremos a un razonamiento microscópico, y consideraremos a cada átomo o molécula del material como una pequeña espira de superficie sm por la que circula una corriente im , dando un momento magnético pm . Calculemos el flujo de las corrientes equivalentes a través de S. Cualquier circuito que corte la superficie sin incluir al contorno, lo hará en dos puntos, en dos direcciones opuestas, y por tanto dará como resultado un flujo nulo. Sólo quedan sin compensar las corrientes que atraviesan S una sola vez, y esas son las que abrazan al contorno C. Sea dl un segmento pequeño de ese contorno. Si en el material hay n moléculas por unidad de volumen, 49 la corriente que atraviesa S en la longitud dl del contorno es di′ = nim dV , con dV = sm dl cos α y siendo α el ángulo que forma la normal a los pequeños circuitos con d¯l. Entonces: di′ = nim sm dl cos α = npm dl cos α, pero esto es justamente J¯ · d¯l. Finalmente, si integramos a todo el contorno: Z C J¯ · d¯l = Z S j̄ ′ · dS̄ (115) pero la integral de circulación sabemos que es la integral de superficie del rotacional, luego: Z C Z J¯ · d¯l = y ası́ encontramos que S ¯ · dS̄ = (∇ × J) Z S ∇ × J¯ = j̄ ′ 3.7 j̄ ′ · dS̄ = i′ (116) (117) Vector H̄ Ası́ pues, la ley de Ampere aplicada a un material magnético ha de incorporar las corrientes equivalentes, y escribirse como Z B̄ · d¯l = µ0 (i + i′ ) C (118) Pero esta expresión no es útil, porque las i′ dependen de B̄, que a su vez depende de i′ . Por eso escribimos: Z ! B̄ − J¯ d¯l = i µ0 C (119) Introducimos el vector auxiliar H̄ = B̄/µ0 − J¯ y tenemos la versión para medios magnéticos de la ley de Ampere: o en formato diferencial: Z C H̄ · d¯l = i ∇ × H̄ = j̄ (120) (121) Si suponemos una dependencia lineal de J¯ con H̄, de la forma J¯ = χm H̄, entonces H̄ = B̄ − χm H̄ µ0 50 (122) de donde B̄ = µµ0 H̄ (123) con µ = 1 + χm . A χm se le llama ”susceptibilidad magnética”. Se puede ver ahora que en un medio homogéneo, si no hay corrientes de conducción j̄ tampoco hay corrientes equivalentes j̄ ′ . En efecto: ′ i = Z S ′ j̄ · dS̄ = Z C J¯ · d¯l = χm Z C H̄ · d¯l = i (124) de manera que i′ = χm i y j̄ ′ = χm j̄. De aquı́ se ve que j̄ ′ = 0̄ si j̄ = 0̄. 3.8 Condiciones de contorno De manera similar a como hicimos con el campo eléctrico, ahora partiremos de: y Z C Z C B̄ · dS̄ = 0 (125) H̄ · d¯l = i (126) para deducir condiciones de contorno. De la primera, tomando un pequeño cilindro de altura despreciable y caras paralelas a la superficie de separación de dos medios magnéticos, despreciando el flujo en la superficie lateral: B1n ∆S − B2n ∆S = 0 (127) de donde B1n = B2n . De la segunda, tomando un pequeño circuito rectangular de lados dl paralelos a la interfaz y lados perpendiculares a la misma de longitud despreciable, se sigue H1t − H2t = jn (128) donde jn es la componente de la corriente de conducción perpendicular al circuito considerado. Si esta densidad es nula, entonces H1t = H2t . Igual que en el caso de las lı́neas de campo eléctrico, se puede ver aquı́ que existe una refracción. 51 3.9 Campo en un medio magnético homogéneo Hemos dicho que el campo B̄ es debido tanto a las corrientes de conducción como a las corrientes equivalentes originadas en el momento intrı́nseco magnético de los materiales. El problema es que esas corrientes son a su vez función del campo. Hay un caso sin embargo en que se puede razonar sobre la configuración total del campo, y es cuando el medio está completamente ocupado por un material magnético homogéneo. Supongamos una zona del espacio que contiene sólo corrientes de conducción, que dan lugar a un campo B̄0 . Si rellenamos el espacio circundante a los conductores con un material magnético, no conductor, homogéneo e isótropo, aparecerá una magnetización en su superficie, inducida por B̄0 , que podemos atribuir a corrientes superficiales. Considerando un circuito que rodea a un conductor, que consideramos fino: Z C J¯ · d¯l = χm Z C H̄ · d¯l = i′ = χm i (129) Quiere decir que el campo de magnetización creado por i′ no difiere del campo B̄0 más que en una constante en cada punto. El campo total es entonces B̄ = B̄0 + B̄ ′ = (1 + χm )B̄0 = µB̄0 (130) ¯ y además hay una relación simple entre el campo de magnetización y J, ya que B̄ ′ = B̄ − B̄0 = (1 − 1 )B̄ µ (131) ¯ m , se sigue B̄ ′ = µ0 J. ¯ y como B̄ = µµ0 H̄ y H̄ = J/χ 3.10 Inducción magnética El fenómeno de la inducción, descubierto por Faraday en 1831, consiste en la aparición de una correinte en una espira cerrada cuando varı́a el flujo de campo magnético que la atraviesa. Esto delata la aparición de una fuerza electro-motriz. Esta fem no depende de la forma cómo se consiguió el cambio de flujo, sino sólo de la derivada: dΦ (132) dt Es decir, el resultado es el mismo cuando el cambio se consigue moviendo la espira, o alterando el campo B̄ que la atraviesa, o ambas cosas a la vez. E =− 52 Además, se cumple la ley de Lenz: la corriente inducida es tal que crea un campo cuyo flujo se opone al flujo que la causó. Esto explica el signo menos en la ecuación anterior. La unidad de flujo es el Weber. Si la variación en el flujo es 1 W b/s, entonces E = 1V . Si la espira no es simple, sino que contiene n vueltas, entonces el flujo es n veces el flujo que atraviesa una espira simple. El origen de E ası́ como su sentido se puede ver considerando un experimento en que un circuito rectangular tiene un lado deslizante. Cuando éste se mueve con velocidad v̄ aparece una fuerza de Lorentz sobre los electrones del conductor, que se ponen en circulación. Esta corriente crea a su vez un campo magnético, y se ve que el sentido de éste es contrario al del que originó el movimiento de los electrones. Aquı́, el Ē ⋆ de la ecuación (85) es v̄ × B̄, y se ve también que tiene sentido contrario al de la circulación que determina la normal a la superficie de la espira. Se ve que dΦ Ē ⋆ · d¯l = −vBl = − (133) dt C Un caso distinto ocurre cuando el área es fija y el cambio en el flujo viene por el cambio en B̄. Como las dos únicas fuerzas posibles son q Ē y q[v̄ × B̄] y la segunda no puede ser 4 , se concluye con que hay una fuerza eléctrica tal que E= de donde Z Z d Ē · d¯l = − dt C Z S B̄ · dS̄ = − Z S ∂ B̄ · dS̄ ∂t (134) ∂ B̄ (135) ∂t que está en aparente contradicción con (9), que nos indica que ∇× Ē = 0̄. La contradicción es sólo aparente, porque allı́ considerábamos un campo electrostático, y aquı́ no. El campo eléctrico total será la suma del electrostático y del variable. Como el rotacional del electrostático es nulo, la ecuación anterior es válida para el campo total. ∇ × Ē = − 3.11 Autoinducción e inducción mutua Como el origen del cambio en el flujo es irrelevante, puede darse y se da de hecho el fenómeno en una espira aislada por la que circula una corriente variable. Entonces, la variación de la corriente crea una variación en el flujo, que crea una E que se opone a la que crea la variación del flujo. Entonces, al 4 En el ejemplo del circuito con un lado deslizante, se ve que v̄ = 0. 53 cerrar una espira abierta se induce una E que se opone al establecimiento de la corriente. Al abrir el circuito, se induce una fem que tiende a hacer que continúe la corriente. Por otro lado, cuando se tienen dos espiras, el flujo que atraviesa una de ellas depende de la corriente que atraviesa a la otra, y viceversa: Φ1 = L12 i2 Φ2 = L21 i1 (136) Es un hecho experimental, y cálculos detallados lo pueden confirmar, que L12 = L21 . 4 Bibliografı́a De entre la gran cantidad de bibliografı́a, recomendamos aquı́ el excelente ”Basic laws of electromagnetism”, de I. E. Irodov. La virtud de este libro es que tiene una coherencia lógica perfecta y que no contiene innecesarias distracciones. De un nivel algo superior, puede consultarse ”Campos y ondas electromagnéticos”, de P. Lorrain y Dale R. Corson. 5 Resumen conceptual 1. Concepto de campo. 2. Campo eléctrico: de una carga y de una distribución, discreta y continua. 3. Rotacional y divergencia en una región libre de cargas. Ecuación de Laplace. 4. Divergencia en una región que contiene cargas. Ecuación de Poisson. 5. El campo eléctrico en la materia. Conductores y dieléctricos. 6. Campo y fuerza superficial en un conductor. 7. Dieléctricos. Dipolo y momento dipolar. 8. Vector P̄ . Propiedades. Vector D̄, propiedades. 9. Condiciones de contorno. 54 10. Energı́a del campo eléctrico. 11. Corriente. 12. Campo magnético. Fuerza de Lorentz. Ley de Biot-Savart. Campo creado por una distribución de corriente. 13. Divergencia de B̄. Circulación de B̄. Ley de Ampere. 14. Fuerzas y pares sobre conductores. ¯ Circulación de J. ¯ 15. Magnetismo en la materia. Vector J. 16. Vector H̄. Condiciones de contorno. 17. Inducción magnética y rotacional de Ē. Autoinducción e inducción mutua. 6 Ejercicios 1. Dada una distribución superficial uniforme de carga de densidad σ sobre el plano (x, y), calcular el campo eléctrico en el punto (0, 0, z). 2. Encontrar la energı́a de interacción de cinco cargas eléctricas q situadas en los vértices de un pentángono regular de lado a. 3. Encontrar el campo magnético creado por un hilo de longitud l a una distancia l medida por la perpendicular al hilo desde uno de sus extremos. Por el hilo circula una intensidad i. Usar el resultado para calcular el campo en el centro de una espira cuadrada de lado l. 4. Sean dos hilos paralelos y una espira rectangular, dos de cuyos lados, de longitud h, son paralelos a los hilos. Los otros dos lados tienen longitud w. ra es la distancia del hilo más cercano a la espira al lado de ésta más cercano a él. rb es la distancia del hilo más alejado al lado de la espira más cercano a él. Por los hilos circulan intensidades i, de sentidos contrarios, que cambian con velocidad di/dt. Calcular la fuerza electro-motriz inducida en la espira. 55 III Sistemas electromecánicos 1 Motivación Consideremos una masa m sometida a una fuerza u moviéndose en una dimensión. Llamemos q a su coordenada. Además de u, sobre la masa actúa un resorte elástico de constante k y un amortiguador de fricción de constante β. Aplicando la ecuación de Newton a esta masa tenemos que mq̈ = u − kq − β q̇ (1) u − mq̈ − β q̇ − kq = 0 (2) o Sea ahora un circuito RLC sencillo, de una sola malla, con una fuente de alimentación que establece una ddp de u. Por el circuito circula una carga q. La ecuación de este circuito es di q + Ri + dt C reordenando y teniendo en cuenta que i = dq/dt: u=L u − Lq̈ − Rq̇ − q/C = 0 (3) (4) La semejanza es evidente: la bobina de autoinducción L se corresponde con la inercia de la masa m. La resistencia se corresponde con el amortiguador, y el condensador con el resorte. Estas semajanzas permiten plantear la cuestión de si serı́a posible tener una teorı́a general que pudiese acomodar sistemas con partes mecánicas y eléctricas, de forma que pudiesen resolverse simultáneamente las partes eléctricas y mecánica, más la interacción entre ellas. Para ilustrar con un ejemplo lo que queremos decir, imagı́nese una circuito RLC sencillo de una sola malla, alimentado mediante una ddp u, donde el condensador de placas paralelas está construido de la siguiente forma: la distancia entre las placas no es fija, sino que una placa está fija y la otra puede acercarse o alejarse de la otra, mediante un muelle de constante k. Al circular la corriente, se polariza el condensador, y la fuerza entre las placas hace que éstas se acerquen. Esta variación en la capacidad influye en la corriente circulante y por tanto en la fuerza entre las placas del condensador, por lo que se altera su movimiento, lo cual altera a su vez su capacidad, que modifica la corriente circulante, etc. 56 2 Hacia una teorı́a unificada En principio, la unificación de la Mecánica con la Electricidad no parece posible, a pesar de las evidentes semejanzas que se ven en las ecuaciones (1) y (2). El problema es que la Mecánica newtoniana es una teorı́a vectorial, mientras que la teorı́a de circuitos es una teorı́a escalar. Ahora bien: la mecánica newtoniana tiene algunos serios inconvenientes, y debido a eso ya en el siglo XVIII se buscaron formulaciones alternativas. Una de estas alternativas es la formulación de Lagrange. La formulación de Lagrange es ya una formulación escalar, igual que la de circuitos. Una vez situados en una teorı́a mecánica escalar, es fácil sacar provecho de las semejanzas entre sistemas mecánicos y eléctricos, y extenderla para incluir a los últimos. Pero, ¿cuales son los inconvenientes de la teorı́a de Newton? 1) En primer lugar, es una teorı́a vectorial, y esto implica que los problemas se plantean en sistemas de referencia cartesianos, lo cual puede no ser adecuado. Por ejemplo, la posición de un péndulo simple viene dada de forma unı́voca por el ángulo que forma con la vertical. Pero en la formulación de Newton es imprescindible usar coordenadas cartesianas, que son dos si el movimiento es en el plano. 2) En segundo lugar, es una teorı́a que es sólo válida en un tipo particular de sistemas llamados ”inerciales”. Cuando los sistemas no son inerciales, es preciso incluir fuerzas ficticias que hacen artificiosa la solución. 3) En tercer lugar, en la ecuación de Newton, F̄ = mā, F̄ es la resultante de todas las fuerzas que actúan sobre la masa m. Algunas de esas fuerzas pueden ser desconocidas, y entran en el problema como incógnitas, complicando la solución. Por ejemplo, sobre la masa de un péndulo actúa la gravedad, pero también la tensión del hilo, que a su vez depende del movimiento de la masa. 4) Es una formulación adecuada para sistemas de partı́culas, pero poco adecuada para sólidos y sistemas continuos. En la formulación de Newton, cada uno de los cuerpos se aisla mentalmente, se hace recuento de todas las fuerzas que actúan sobre él y se escribe su ecuación del movimiento. Si hay n cuerpos este proceso se repite n veces para obtener un sistema de n ecuaciones. Pero un sólido continuo contiene una infinidad de partı́culas, y es evidente entonces que la solución no es factible a menos que se introduzcan hipótesis adicionales. Estas hipótesis fueron introducidas por Newton, y son el principio de acción y reacción y el que las fuerzas entre partı́culas sean centrales. La mecánica de Lagrange resuelve todos estos inconvenientes: 1) Pueden usarse aquellas coordenadas que mejor describan la configuración del sistema. En el caso del péndulo, basta usar el ángulo θ: el 57 procedimiento de Lagrange da entonces una sola ecuación en θ. 2) Es válida en cualquier sistema de referencia, inercial o no. No es preciso por tanto inventar fuerzas ficticias. 3) Las fuerzas desconocidas, como tensiones y, en general, las fuerzas que limitan el movimiento, quedan excluidas de la formulación del problema. No es preciso preocuparse por ellas. Al mismo tiempo, si se desea, pueden calcularse después. 4) El método de Lagrange se aplica a sistemas completos: no es preciso individualizar cada parte y razonar sobre ella. De hecho, las ecuaciones del movimiento se obtienen a partir de una cantidad escalar T que es función sólo de las coordenadas elegidas para representar la posición del sistema. En el caso del péndulo, no es preciso conocer la tensión de la cuerda y T es una función sólo de θ. 3 3.1 Mecánica de Lagrange Principio de D’Alembert La Mecánica lagrangiana es una formulación radicalmente diferente de la mecánica, y muy distinta de la Mecánica de Newton. No es entonces extraño que parta de un principio radicalmente diferente. Este principio es el de los trabajos virtuales de D’Alembert, que establece que, para un sistema de masas mi sometidas cada una de ellas a fuerzas resultantes F̄i , se cumple que X i (F̄i − mi āi ) · δr̄i = 0 (5) A primera vista, este principio no difiere de la ecuación de Newton, e incluso parece que se deduce de él, porque, si la ecuación de Newton nos dice que F̄i − mi āi = 0, sea lo que sea que signifique δr̄i , es claro que de la ecuación de Newton se deduce el principio de D’Alembert. Pero no es ası́. El motivo principal es que en la ecuación de Newton la fuerza F̄i es la resultante de todas las fuerza que actúan sobre mi , incluidas las fuerzas que, de alguna manera, restringen el movimiento de mi . Por ejemplo, la ecuación de Newton, en el caso del péndulo, incluye la tensión de la cuerda, responsable de que el movimiento transcurra de tal forma que la distancia de la masa del péndulo al punto de suspensión permanezca constante. O, por ejemplo, cuando una masa se mueve sobre una superficie plana, existe una fuerza que el plano ejerce sobre la masa, de manera que el movimiento de ésta queda restringido al plano. A estas fuerzas que restringen el movimiento se las llama ”fuerzas de ligadura”. Pero en el principio de D’Alembert F̄i es 58 la resultante de las fuerzas que actúan sobre mi , excluidas las fuerzas de ligadura. Por tanto, de la ecuación de Newton no puede deducirse el principio de D’Alembert o ”principio de los trabajos virtuales”, y debe considerarse un principio independiente. Una vez establecido qué es F̄i , es preciso ver qué es δr̄i . Son ”desplazamientos virtuales”. Un desplazamiento virtual es la diferencia entre dos movimientos reales posibles. Veámoslo con un ejemplo. Una masa m se mueve sobre una superficie. Desde un punto de esa superficie, m puede moverse en un plano tangente a la misma. La diferencia de dos vectores desplazamiento en el plano tangente es otro vector en el plano tangente. Por tanto, en este caso, los desplazamientos virtuales coinciden con desplazamientos reales. Imaginemos ahora que la superficie se mueve con una velocidad ū. El desplazamiento d¯1 de la masa es la composición de su desplazamiento sobre la superficie, dr̄1 más el desplazamiento de la superficie en el intervalo de tiempo dt que haya llevado dr̄1 , y vale ūdt, ası́ que d¯1 = dr̄1 + ūdt. De la misma forma, otro movimiento posible es d¯2 = dr̄2 + ūdt. El desplazamiento virtual es en este caso d¯1 − d¯2 = dr̄1 − dr̄2 . Coincide con el caso anterior, solo que ahora la superficie estaba en movimiento. Es como si el tiempo hubiese sido ”congelado”; como si el movimiento virtual se produjese a t = constante. 3.2 Coordenadas generalizadas El concepto de coordenada generalizada no entra directamente en la formulación vectorial de la Mecánica. Por contra, ocupa un lugar central en la Mecánica Analı́tica, que es una ciencia que reduce los problemas del movimiento de los cuerpos a la aplicación ordenada de procedimientos algebraicos. Lagrange (1736-1813) lo expresó ası́ en su Mechanique Analitique de 1788: Ya existen diversos tratados de Mecánica, pero el programa de éste es completamente nuevo. Me he planteado la tarea de reducir tanto la teorı́a como el arte de resolver los problemas concernientes a esta Ciencia a fórmulas generales cuya simple aplicación dé todas las ecuaciones necesarias para obtener la solución de cada problema. Más aún: No se encontrarán figuras en esta obra. Los métodos que aquı́ expongo no requieren ni imágenes ni razonamientos geométricos o mecánicos, sino tan sólo operaciones algebraicas sujetas a un proceso regular y uniforme. 59 Consideremos un sistema de N partı́culas, cada una de las cuales tiene, en el espacio euclı́deo tridimensional, coordenadas r̄i . Nuestro problema consiste en encontrar r̄i (t), es decir, encontrar 3N funciones del tiempo. Definiremos las coordenadas generalizadas qi como el mı́nimo conjunto de n variables en función de las cuales pueden escribirse los r̄i : r̄i = fi (q1 , · · · , qn , t) (6) q̈i = fi (q1 , · · · , qn , q̇1 , · · · , q̇n , t) (7) A este número mı́nimo le llamaremos grados de libertad del sistema. Por ejemplo, la posición de un péndulo ideal puede darse en función del ángulo que forma con la vertical: n = 1, q1 = θ. La posición de un punto material sobre una superficie f (x, y, z) puede especificarse mediante el par q1 = x, q2 = y, y en este caso n = 2. Ocasionalmente, el conjunto de coordenadas generalizadas adecuadas para un problema en concreto puede coincidir con las coordenadas cartesianas de una o varias de las partı́culas que constituyen el sistema, aunque esto no es lo habitual. En el movimiento de un planeta alrededor del Sol, pueden usarse coordenadas cartesianas, pero son más adecuadas las coordenadas polares. Como último ejemplo, consideremos un sólido rı́gido. Su posición en el espacio puede darse mediante las coordenadas de su centro de masas y tres ángulos que especifican su orientación: es un sistema con seis grados de libertad. Aplicando los principios de la Mecánica Analı́tica encontraremos el conjunto de ecuaciones diferenciales ordinarias: La solución de este conjunto de ecuaciones se considera como la solución del problema y normalmente no se requiere la obtención de las coordenadas cartesianas. 3.3 Ecuaciones de Lagrange Escribiremos el principio de D’Alembert en función de las coordenadas generalizadas qi . Veamos para ello que: δr̄i = X ∂r̄i ∂qj j δqj (8) y transformemos cada uno de los términos en la formulación original. En primer lugar: X i F̄i δr̄i = X i F̄i X ∂r̄i j ∂qj δqj = X X j 60 i ∂r̄i F̄i ∂qj ! δqj = X j Qj δqj (9) donde hemos introducido las fuerzas generalizadas Qj . Por otro lado: X mi āi δr̄i = i X mi i X d X dr̄˙i d δr̄i = (mi r̄˙i δr̄i ) − mi r̄˙i δr̄i dt dt i dt i (10) Para el primer término: X ∂r̄i d X d X δqj mi r̄˙i δr̄i = mi r̄˙i dt i dt i j ∂qj (11) ∂r̄i ∂ r̄˙i = ∂qj ∂ q˙j (12) ∂r̄i dr̄i X ∂r̄i = q˙j + dt ∂t j ∂qj (13) Ahora bien: En efecto: y de esta última se sigue la anterior. Por tanto, el primer término queda: ∂ r̄˙i d X X mi r̄˙i dt j ∂ q˙j i ! d X ∂ δqj = dt j ∂ q˙j X1 i 2 mi r̄˙i 2 ! δqj (14) Para el segundo: X i = X mi r̄˙i X mi r̄˙i X mi r̄˙i i = = ∂qj mi r̄˙i i X ∂ j X ∂ r̄˙i j XX j ∂qj j i = k X ∂ ∂qj ! δqj ! ! X ∂r̄i k ∂r̄i δqj q˙k + ∂qk ∂t δqj ∂ r̄˙i δqj ∂qj X1 i ∂r̄i ∂qj ∂ 2 r̄i q˙k + δqj ∂qj ∂qk ∂qj ∂t X X ∂ 2 r̄i j i = X X d d d X ∂r̄i X mi r̄˙i δr̄i = mi r̄˙i δqj = mi r̄˙i dt dt j ∂qj i i j dt 2 mi r̄˙i 2 ! δqj (15) Definamos el escalar T como 61 T = X1 i 2 mi r̄˙i 2 (16) al que llamaremos Energı́a Cinética. Si ahora reunimos todas las piezas, podemos escribir el principio de D’Alembert en función de las coordenadas generalizadas: X j " # d ∂T ∂T − − Qj δqj = 0 dt ∂ q˙j ∂qj (17) En esta versión del principio de D’Alembert, toda la información sobre el sistema se encuentra sintetizada en el escalar T , y todas las fuerzas aplicadas, en las fuerzas generalizadas Qj . Si las coordenadas qj son realmente coordenadas generalizadas, es decir, el mı́nimo número de parámetros en función de los cuales puede expresarse la posición de cualquier punto del sistema, no existirán relaciones funcionales entre ellas, y las δqj serán independientes, lo que conduce a las n ecuaciones del movimiento d ∂T ∂T − − Qj = 0 dt ∂ q˙j ∂qj (18) para j = 1, · · · , n. 3.4 Procedimiento y ejemplos El procedimiento para encontrar las ecuaciones del movimiento (18) se puede entonces resumir en los siguientes puntos: 1. Escribir T en función de las coordenadas cartesianas. 2. Transformar la expresión, escribiendo las coordenas cartesianas y sus derivadas en función de las coordenadas generalizadas elegidas. 3. Calcular las Qj . 4. Aplicar (18) para cada coordenada generalizada. Ejemplo: ecuaciones del movimiento de una partı́cula de masa m que se mueve en el plano xz bajo la acción de la gravedad. Solución: la energı́a cinética es 1 T = m(ẋ2 + ż 2 ) 2 62 (19) Como hay dos grados de libertad, necesitamos dos coordenadas generalizadas. Estas pueden ser las mismas coordenadas cartesianas, con lo cual nos ahorramos el paso 2). En cuanto a las fuerzas generalizadas, la única fuerza activa es la de la gravedad, de componentes ḡ = (0, −g). Las fuerzas generalizadas son entonces: y Qx = ḡ · ∂r̄ ∂x (20) Qy = ḡ · ∂r̄ ∂y (21) siendo r̄ = (x, y). Entonces ∂r̄/∂x = (1, 0) y ∂r̄/∂z = (0, 1). De aquı́ Qx = 0 y Qz = −g. Las dos ecuaciones del movimiento son: y ∂T d ∂T − − Qx = 0 dt ∂ ẋ ∂x (22) ∂T d ∂T − − Qz = 0 dt ∂ ż ∂z (23) mẍ = 0 mz̈ = −g (24) que se reducen a: Ejemplo: movimiento de un péndulo simple de longitud l y masa m sometido a la gravedad. Lo suponemos contenido en el plano xz, con el eje z dirigido verticalmente hacia abajo. Solución: es evidente que basta saber el ángulo θ que forma el hilo con el eje vertical para determinar la posición del péndulo, luego usaremos θ como única coordenada generalizada. La energı́a cinética es 1 T = m(ẋ2 + ż 2 ) 2 (25) y en función de θ: x = l sin θ z = l cos θ de donde 63 (26) ẋ = lθ̇ cos θ ż = −lθ̇ sin θ (27) con lo cual queda: 1 (28) T = ml2 θ̇2 2 Como sólo hay una coordenada generalizada, sólo hay una ecuación, y sólo una fuerza generalizada Qθ , que es ∂r̄ ∂θ con ḡ = (0, mg) y r̄ = (l sin θ, l cos θ). Derivando: Qθ = ḡ · (29) ∂r̄ = (l cos θ, −l sin θ) ∂θ (30) Qθ = −mlg sin θ (31) ∂T d ∂T − − Qθ = 0 dt ∂ θ̇ ∂θ (32) ml2 θ̈ + mgl sin θ = 0 (33) Finalmente La única ecuación del movimiento es es decir: Ejemplo: una barra rı́gida de longitud l y masa m se encuentra en el plano vertical, apoyada en el suelo y en una pared que forma ángulo recto con el suelo; se supone que no hay rozamiento. Si se abandona desde una posición cualquiera, la barra se desliza y cae. Encontrar la ecuación del movimiento. Solución: hay una sola ecuación del movimiento porque hay sólo una coordenada generalizada, que puede ser el ángulo θ que forma la barra con el suelo. Pero hay una infinidad de elementos de masa, ası́ que la energı́a cinética total se encuentra sumando las energı́as de todos los elementos. Sea uno de estos elementos, situado a una distancia s del extremo inferior de la barra. Las coordenadas de este elemento son xs = (l − s) cos θ zs = s sin θ 64 (34) Si la longitud del elemento es ds, su masa es λds, y su energı́a cinética 1 dTs = λds(ẋ2s + żs2 ) (35) 2 Derivando (34), sustituyendo en (35) e integrando desde s = 0 a s = l, tenemos la energı́a total: 1 T = ml2 θ̇2 (36) 6 La fuerza sobre el elemento λds es ḡ = (0, −λgds) y ∂r̄/∂θ = (−(l − s) sin θ, s cos θ). De aquı́, dQθ = −λg cos θsds. Integrando desde s = 0 a s = l, se tiene que Qθ = − 21 mgl cos θ. Aplicando (18) y tras simplificar un poco se encuentra la ecuación del movimiento de la barra: θ̈ + 3.5 3g cos θ = 0 2l (37) Sistemas con función potencial Puede suceder que las fuerzas aplicadas al sistema deriven de una función potencial, es decir, que exista una función U (q1 , · · · , qn ) tal que: ∂U ∂ r¯i En este caso, las fuerzas generalizadas adoptan la forma sencilla: F̄i = − Qj = X i F̄i X ∂U ∂ r¯i ∂ r¯i ∂U =− =− ∂qj ∂qj i ∂ r¯i ∂qj (38) (39) Las ecuaciones (18) pueden escribirse entonces en la forma: ∂L d ∂L − =0 dt ∂ q˙j ∂qj (40) donde hemos introducido la función L = T − U , conocida como función de Lagrange, o simplemente Lagrangiana. Esta función dependerá en general de las coordenadas y velocidades generalizadas, y posiblemente del tiempo: bien porque la energı́a potencial dependa del tiempo, bien porque las relaciones r¯i (q1 , · · · , qn , t) lo contengan, bien por ambas causas a la vez. Cuando las ecuaciones del movimiento pueden escribirse en esta última forma, que recordemos son ecuaciones diferenciales de segundo orden en las coordenadas generalizadas, es posible averiguar las circunstancias en que existen integrales primeras, que pueden usarse para resolver las ecuaciones del movimiento. 65 En primer lugar, veamos que cuando una coordenada qj no aparece explı́citamente en la Lagrangiana: d ∂L =0 dt ∂ q˙j (41) lo que implica que la cantidad pj = ∂L ∂ q˙j (42) es una constante. A pj se le llama momento generalizado. En segundo lugar, procedamos a calcular la derivada respecto al tiempo de la Lagrangiana: ! ∂L ∂L dL X ∂L = q˙j + q¨j + dt ∂qj ∂ q˙j ∂t j (43) Pero usando (41), dL X d ∂L q˙j = dt ∂ q˙j j dt ! + ∂L ∂t (44) Intercambiando en el segundo miembro derivada y sumatoria: X d ∂L L− pj q˙j = dt ∂t j (45) De manera que cuando L no es función explı́cita del tiempo, resulta que la cantidad h=L− X pj q˙j (46) j es constante. De esta forma, una de las velocidades puede expresarse en función de las coordenadas y velocidades restantes. 3.6 Fuerzas disipativas En general, actuarán sobre los sistemas fuerzas que deriven de un potencial y fuerzas que no deriven de un potencial. Designando estas últimas por Q∗j , es evidente que: d ∂L ∂L − = Q∗j dt ∂ q˙j ∂qj 66 (47) Por otro lado, pueden existir fuerzas de rozamiento dependientes de la velocidad, de la forma F̄i = −k r¯˙i (48) Las fuerzas generalizadas se escriben entonces como: Qj = X i F̄i X X ∂ r¯i ∂F ∂ r¯i ∂ r¯˙i =− =− =− k r¯˙i k r¯˙i ∂qj ∂qj ∂ q˙j ∂ q˙j i i (49) donde hemos introducido la función de disipación de Rayleigh F: F= X1 i 2 k r¯˙i 2 (50) Para tales sistemas, donde parte de las fuerzas derivan de un potencial y otra parte son fuerzas disipativas, las ecuaciones del movimiento son: ∂L ∂F d ∂L − + =0 dt ∂ q˙j ∂qj ∂ q˙j 4 (51) Sistemas electromecánicos A continuación trazaremos el paralelismo entre los sistemas eléctricos y los sistemas mecánicos, veremos la forma de escribir la ”energı́a cinética” para los sistemas eléctricos, cómo calcular las ”fuerzas generalizadas” y consecuentemente cómo calcular las ”ecuaciones del movimiento”. Finalmente, ilustraremos el procedimiento con algunos ejemplos. 4.1 Coordenadas generalizadas En un circuito formado por una serie de ramas, las coordenadas generalizadas son las cargas qj que circulan por cada rama. Ahora bien, en el paso de (17) a (18) hemos supuesto que todas las coordenadas generalizadas son independientes. Usualmente, en los circuitos eléctricos esto no sucede ası́, porque en cada nudo, que son los puntos en que confluyen tres o más ramas, ha de suceder que la suma de las intensidades entrantes iguale a la suma de las intensidades salientes. Esta condición constituye una ecuación, que puede usarse para escribir una de las qj en función de las demás. Aplicando el mismo procedimiento a todos los nudos, se pueden eliminar las coordenadas superfluas. 67 4.2 Energı́a cinética La energı́a cinética de una masa que se mueve en una dimensión es 1 T = mq̇ 2 (52) 2 La energı́a cinética de una serie de masas mi con coordenadas r̄i es T = 1X 2 mi r̄˙ i 2 i (53) Cuando las r̄i son funciones de las coordenadas generalizadas (no consideramos el caso en que son funciones también del tiempo) tenemos que r̄˙ i = X ∂r̄i j y 2 r̄˙ i = X j,k ∂r̄i ∂qj ! (54) ∂qj ! X ∂r̄i Aij,k q̇j q̇k q̇j q̇k = ∂qk j,k (55) de forma que la energı́a cinética es T = XX 1 j,k i 2 mi Aij,k q̇j q̇k = 1X Mj,k q̇j q̇k 2 j,k (56) Ahora, el paralelo eléctrico: La energı́a magnética en una bobina de autoinducción L por la que circula una intensidad i = q̇ es 1 T = Lq̇ 2 (57) 2 (57) es el equivalente de (52). La energı́a magnética de una serie de bobinas con coeficientes de inducción Lj y de inducción mutua Mj,k (Mj,j = Lj ) por las que circulan intensidades ij = q̇j es T = 1X Mj,k q̇j q̇k 2 j,k (58) y (56) tienen exactamente la misma forma. 68 (58) 4.3 Energı́a potencial En un circuito eléctrico, la ”energı́a potencial” se encuentra en dos sitios: en las fuentes de voltaje y en los condensadores. En el campo de la gravedad, la energı́a potencial de un cuerpo situado a altura q (el eje q está dirigido hacia arriba) es u = mgq. La energı́a suministrada por una fuente de voltaje u es uq. Por otro lado, la energı́a almacenada en un resorte de constante k es 1 2 kq 2 y la energı́a almacenada en un condensador de capacidad C es (59) 1 q2 (60) 2C (59) y (60) tienen exactamente la misma forma. En general, la ”energı́a potencial” de una malla que contiene r condensadores y s fuentes de voltaje es U= X 1 qr2 r 4.4 2C − X us q s (61) s Fuerzas generalizadas Comparando (18) y (51), se ve que las fuerzas generalizadas Qj , cuando hay fuerzas aplicadas que derivan de un potencial y fuerzas disipativas, se pueden poner como Qj = − ∂F ∂U − ∂qj ∂ q̇j (62) En los sistemas eléctricos, U viene dada por (61) y se toma F= 1X Rp q̇p2 2 p (63) cuando se tiene un sistema de p resistencias Rp por las que circulan cargas qp . 4.5 Selección de ejemplos Mostramos a continuación una serie de ejemplos. Para hacerlos más ilustrativos, algunos los resolveremos por duplicado: una vez por los medios convencionales y otra usando el formalismo lagrangiano. Se verá que este formalismo no parece muy ventajoso: esto se debe a que los ejemplos que 69 elegimos son sencillos: no son difı́ciles de resolver ni por un medio ni por otro. Posteriormente, consideraremos algún ejemplo más complejo, y alguno en que el sistema contiene partes eléctricas y partes mecánicas. Ejemplo 1: Resolver el circuito de la Figura 1. Figura 1 a) Método convencional. Sólo hay una malla, por tanto una corriente. Recorriendo la malla u − iR = 0, de donde obtenemos la intensidad i = u/R. b) Método lagrangiano. La ”energı́a cinética” es nula, porque no hay autoinducciones. La ”energı́a potencial” es U = −uq y la función de Rayleigh F = (1/2)Rq̇ 2 . La única ecuación de Lagrange es 0=− ∂U ∂F − ∂q ∂ q̇ (64) de donde u = Rq̇ = Ri. Ejemplo 2: Resolver el circuito de la Figura 2. a) Método convencional. Igualando las subidas y bajadas de potencial a lo largo de la malla: di = Rq̇ + Lq̈ (65) dt b) Método lagrangiano. La energı́a cinética está asociada a la bobina, y u = Ri + L es 1 T = Lq̇ 2 2 70 (66) Figura 2 La ”energı́a potencial” a la fuente, y es U = −uq (67) y la función de Rayleigh es 1 F = Rq̇ 2 2 La única ecuación de Lagrange es ∂T ∂U ∂F d ∂T − =− − dt ∂ q̇ ∂q ∂q ∂ q̇ (68) (69) Efectuando las operaciones, encontramos u = Rq̇ + Lq̈, de acuerdo con el método convencional. Ejemplo 3: Resolver el circuito de la Figura 3. a) Método convencional. Igualando ganancias y pérdidas de potencial en un recorrido de la malla: u = Lq̈ + q/C (70) b) Método lagrangiano: T = (1/2)Lq̇ 2 , F = 0 y U = −uq + (1/2)q 2 /C. Hay una única ecuación. Efectuando las operaciones: u = Lq̈ + q/C. Ejemplo 4: Resolver el circuito de la Figura 4. La ”energı́a cinética” está asociada tanto a las autoinducciones como a la inducción mutua entre ambas bobinas: 71 Figura 3 Figura 4 1 1 T = L1 q̇12 + L2 q̇22 + L12 q̇1 q̇2 2 2 La ”energı́a potencial” es (71) U = −uq1 (72) 1 F = Rq̇22 2 (73) y la función de Rayleigh Las dos ecuaciones son 72 d ∂T ∂U ∂F =− − dt ∂ q̇1 ∂q1 ∂ q̇1 (74) d ∂T ∂U ∂F =− − dt ∂ q̇2 ∂q2 ∂ q̇2 (75) y Efectuando las operaciones: u = L1 q̈1 + L12 q̈2 0 = Rq̇2 + L2 q̈2 + L12 q̈1 (76) Ejemplo 5: Resolver el circuito de la Figura 5. Figura 5 La ”energı́a cinética”, ”energı́a potencial” y función de Rayleigh son T =0 y U = −u1 q1 + u2 q2 + (77) 1 q32 2C (78) 1 1 F = R1 (i1 − i2 )2 + R2 (i3 − i2 )2 (79) 2 2 Ahora hay dos ecuaciones como (74) y (75) y otra adicional para la tercera carga. Efectuando las operaciones: 73 u1 = R1 (q̇1 − q̇2 ) u2 = R1 (q̇1 − q̇2 ) + R2 (q̇3 − q̇2 ) 0 = −q3 /C − R2 (q̇3 − q̇2 ) 4.6 (80) Un sistema mixto El sistema de la Figura 6 contiene una parte mecánica y una eléctrica. Figura 6 El circuito está excitado por una señal senoidal u = u0 sin ωt y del mismo forma parte un condensador, una de cuyas placas está sostenida por un resorte de constante k. En la posición de equilibrio, la separación entre placas es s. La capacidad es una función de x, separación de la placa superior de la posición de equilibrio, de la forma: A (81) s−x La masa de la placa superior del condensador es m. Ahora, la energı́a cinética contiene dos términos, uno correspondiente a la bobina y otro al movimiento de m: C= 1 1 T = Lq̇ 2 + mẋ2 2 2 74 (82) La energı́a potencial contiene también dos términos. Una parte eléctrica, que incluye a la fuente y al condensador, y una parte mecánica, que incluye al resorte k: 1 q 2 (s − x) 1 2 + kx 2 A 2 La función de disipación es debida a la resistencia: U = −u0 q sin ωt + (83) 1 F = Rq̇ 2 (84) 2 Hay dos ecuaciones, una para la carga circulante y otra para la coordenada x de la parte mecánica. La obtención de las ecuaciones del sistema es inmediata y ya pone de manifiesto la potencia del método que hemos presentado: Lq̈ + Rq̇ + q(s − x)/A = u0 sin ωt mẍ + kx − q 2 /(2A) = 0 5 (85) Sistemas lineales La mayorı́a de los ejemplos que hemos ido encontrando dan como resultado ecuaciones o sistemas de ecuaciones lineales, donde aparecen ciertas incógnitas y sus derivadas respecto al tiempo, multiplicadas por constantes. Además, pueden aparecer funciones del tiempo en términos adicionales (no multiplicando a las incógnitas). Todos estos sistemas se pueden escribir de la misma forma: x̄˙ = Ax̄ + Bū (86) Por ejemplo, si consideramos la ecuación (1): k β q̇ + q = u m m e introducimos las variables de estado q̈ + x1 = q x2 = q̇ es claro que 75 (87) (88) ẋ1 = x2 ẋ2 = u − β k x1 − x2 m m (89) que en formato matricial se puede escribir: " ẋ1 ẋ2 # = " 0 1 −k/m −β/m #" x1 x2 # + " 0 1 # u (90) La técnica es general: una ecuación diferencial ordinaria lineal en coeficientes constantes de orden n puede sustituirse por un sistema de n ecuaciones de primer orden, introduciendo n variables de estado. Por ejemplo: d2 y dy d3 y + 6 − 8 + 2y = u(t) 3 2 dt dt dt se puede transformar introduciendo las tres variables de estado x1 = y x2 = ẏ x3 = ÿ (91) (92) con lo cual: x1 0 ẋ1 0 1 0 x 0 0 1 ẋ + = 2 0 u(t) 2 x3 −2 8 −6 ẋ3 1 (93) Pues bien, encontraremos la solución general para este tipo de sistemas. Ciertamente, hay muchos sistemas que no son lineales, pero también es cierto que en muchos sistemas no lineales interesa el comportamiento en las cercanı́as de ciertos valores, y eso permite hacer aproximaciones lineales. La técnica que emplearemos para resolver estos sistemas consta de dos pasos: primero buscaremos la solución del sistema cuando ū = 0̄ y después modificaremos la solución encontrada para que sea válida para el caso general. a) Paso 1. Consideramos x̄˙ = Ax̄. Si en el segundo miembro tomamos aproximadamente x̄(t) ≈ x̄(0) podremos integrar fácilmente, y obtener x̄(t) = (I+At)x̄(0). Ahora, podemos usar esta aproximación para buscar una mejor, poniendo x̄˙ = (I + At)x̄(0), que se integra fácilmente de nuevo para dar x̄(t) = (I + At + (1/2)A2 t2 )x̄(0) El procedimiento se puede iterar, dado la serie: 76 x̄(t) = (I + At + (1/2)A2 t2 + (1/3!)A3 t3 + · · · + (1/n!)An tn + · · ·)x̄(0) (94) La serie entre paréntesis es formalmente idéntica a la de la exponencial de números reales, ex = 1 + x + x2 /2 + x3 /3! + · · · + xn /n! + · · ·, ası́ que escribimos en forma abreviada x̄(t) = eAt x̄(0) (95) b) Paso 2. Ahora vamos a la ecuación no homogénea: x̄˙ = Ax̄ + Bū y tratamos de adaptarle la solución encontrada. Para ello, la idea consiste en tomar no x̄(t) = eAt x̄(0), sino x̄ = eAt c̄(t), y elegir c̄(t) de forma adecuada para que se satisfaga la ecuación no homogénea. En efecto, derivando esta solución de prueba, y sustituyendo en la ecuación diferencial original: x̄˙ = AeAt c̄(t) + eAt c̄˙ (96) eAt c̄˙ (t) = Bū(t) (97) y Ahora, es fácil convencerse de que eAt −1 = e−At (98) por ejemplo, escribiendo las series correspondientes, efectuando las multiplicaciones y comprobando que en efecto el producto de ambas matrices es la identidad. Entonces, de (97) c̄˙ (t) = e−At Bū(t) (99) que se integra fácilmente: Z c̄(t) = c̄(0) I + t 0 (100) eA(t−τ ) Bū(τ )dτ (101) e −Aτ Bū(τ )dτ de donde ya, sin más Z At x̄(t) = e c̄(0) + t 0 a la vista de la cual, es obvio que c̄(0) = x̄(0), ası́ que At x̄(t) = e x̄(0) + Z t 0 77 eA(t−τ ) Bū(τ )dτ (102) Esta es una solución formal, que se basa en que sepamos calcular la matriz exponencial, que a su vez es una serie infinita. En realidad, no es preciso calcular la serie infinita. Si la matriz A tiene dimensiones de n×n, entonces la exponencial, o en general cualquier polinomio en A, del grado que sea, tiene como mucho n términos. Para demostrar este resultado, nos apoyaremos en un teorema trascendental, que es el teorema de Cayley-Hamilton, que pasamos a demostrar. 6 El teorema de Cayley-Hamilton Demostraremos el teorema de Cayley-Hamilton, a partir del cual veremos cómo es posible calcular una función analı́tica arbitraria f (A) de una matriz cuadrada, como por ejemplo la matriz exponencial. Dada una matriz cuadrada A, la ecuación caracterı́stica |A − λI| = 0 es un polinomio p(λ); si A es una matriz n×n, entonces p(λ) es un polinomio de grado n en λ. El teorema de Cayley-Hamilton afirma que si p(λ) = 0 es la ecuación caracterı́stica de una matriz A, entonces A satisface su propia ecuación caracterı́stica, es decir, que p(A) = 0. Por ejemplo, si 1 2 3 A = 5 7 11 13 17 19 entonces p(λ) = −λ3 + 27λ2 + 77λ + 24 (103) (104) y se comprueba que −A3 + 27A2 + 77A + 24I = 0 (105) Para demostrar el teorema, comenzamos con un resultado del álgebra: (A − λI)−1 = (m(A − λI))T |A − λI| (106) donde m(A − λI) es una matriz cuyo elemento mij es (−1)i+j κij (A), siendo κij (A) el determinante de la matriz resultante de eliminar de A la fila i y la columna j. Como |A − λI| = 0: p(λ)I = (m(A − λI))T (A − λI) 78 (107) Ahora bien, (m(A−λI))T es una matriz polinómica en λ de grando n−1, es decir, existen matrices Bi tales que (m(A − λI))T = Bn−1 λn−1 + Bn−2 λn−2 + · · · + B1 λ + B0 (108) En efecto, cada elemento de (m(A − λI))T es un polinomio en λ de grado n − 1, y es posible recolectar en una matriz todos los coeficientes correspondientes a una misma potencia de λ. Por ejemplo, si λ2 − 26λ − 54 2λ + 13 3λ + 1 5λ + 48 λ2 − 20λ − 20 11λ + 4 E(λ) = 13λ − 6 17λ + 9 λ2 − 8λ − 3 (109) es posible escribir 1 0 0 −26 2 3 −54 13 1 2 E(λ) = 48 −20 4 + 5 −20 11 λ + 0 1 0 λ (110) 0 0 1 13 17 −8 −6 9 −3 Ası́ pues: (m(A − λI))T (A − λI) = (Bn−1 λn−1 + Bn−2 λn−2 + · · · + B1 λ + B0 )(A − λI) = −Bn−1 λn + (Bn−1 A − Bn−2 )λn−1 + (Bn−2 A − Bn−3 )λn−2 + · · · · · · + (B2 A − B1 )λ2 + (B1 A − B0 )λ + B0 A (111) Pero al mismo tiempo sucede que o p(λ) = (−1)n λn + cn−1 λn−1 + · · · + c1 λ + c0 (112) p(λ)I = (−1)n Iλn + cn−1 Iλn−1 + · · · + c1 Iλ + c0 I (113) Si ahora igualamos coeficientes: −Bn−1 = (−1)n I Bn−1 A − Bn−2 = cn−1 I Bn−2 A − Bn−3 = cn−2 I 79 ··· B2 A − B1 B1 A − B0 B0 A = = = = ··· c2 I c1 I c0 I (114) Sustituyamos Bn−1 de la primera en la segunda, Bn−2 de la segunda en la tercera, y ası́ sucesivamente, y obtenemos: −Bn−1 −Bn−2 −Bn−3 −Bn−4 ··· −B2 −B1 = = = = = = = (−1)n I cn−1 I + (−1)n A cn−2 I + cn−1 A + (−1)n A2 cn−3 I + cn−2 A + cn−1 A2 + (−1)n A3 ··· c3 I + c4 A + c5 A2 + · · · + (−1)n An−3 c2 I + c3 A + c4 A2 + · · · + (−1)n An−2 (115) y finalmente −B0 = c1 I + c2 A + c3 A2 + · · · + (−1)n An−1 (116) −(c1 A + c2 A2 + c3 A3 + · · · + (−1)n An ) = c0 I (117) c0 I + c1 A + c2 A2 + · · · + (−1)n An = 0 (118) p(A) = 0 (119) que se obtiene de sustituir B1 en la penúltima ecuación. Entonces, sustituyendo B0 en la última: o es decir: como querı́amos demostrar. 7 Función de una matriz y matriz exponencial En primer lugar, vemos que cualquier potencia de una matriz n × n se puede escribir como una suma de potencias de, a lo sumo, grado n−1. Por ejemplo, 80 si A= " 1 2 3 4 # (120) tenemos que p(λ) = λ2 − 5λ − 2, luego, según el teorema de CayleyHamilton, A2 = 5A+2I; a partir de aquı́, A3 = 27A+10I, A4 = 145A+54I, y ası́ sucesivamente. Cualquier polinomio f (A) puede escribirse entonces como un polinomio de grado n − 1. Pero hay un procedimiento mejor. En efecto, considérese una matriz cuadrada A y un polinomio s(λ), y sea p(λ) el polinomio caracterı́stico de A. Escribimos s(λ) en la forma s(λ) = q(λ)p(λ) + r(λ) (121) donde q(λ) lo encontramos por división polinómica y r(λ) es a lo sumo de grado n − 1 si p(λ) es de grado n. Ahora bien, cuando λj es precisamente un valor propio, p(λj ) = 0 y queda s(λj ) = r(λj ) (122) s(A) = q(A)p(A) + r(A) (123) De la misma manera Pero por el teorema de Cayley-Hamilton p(A) = 0 y por tanto s(A) = r(A) (124) Como ejemplo, sea A= " 1 2 3 4 # (125) y supongamos que deseamos calcular s(A) = A4 + 3A3 + 2A2 + I. La ecuación caracterı́stica es λ2 − 5λ + 5 = 0 (126) Dividiendo: λ4 + 3λ3 + 2λ2 + 1 146λ − 184 = λ2 + 8λ + 37 + 2 2 λ − 5λ + 5 λ − 5λ + 5 El resto es por consiguiente r(λ) = 146λ − 184, ası́ que 81 (127) s(A) = 146A − 184I (128) Pero, ¿qué ocurre si el grado del polinomio s(A) es muy grande? En ese caso, puede ser sumamente tedioso, e incluso impracticable, efectuar la división polinómica. De nuevo, hay un camino rápido. Supongamos que deseamos calcular un polinomio de grado muy elevado, o incluso una serie infinita de potencias f (λ) = ∞ X α k λk (129) k=0 Sabemos que podemos escribir f (λ) = q(λ)p(λ) + r(λ) (130) Lo que hemos de ver aquı́ es que, para cada λ que sea valor propio, es irrelevante cual sea q(λ), ya que viene multiplicado por un p(λ) = 0. Y de la misma forma, es irrelevante cual sea r(λ), desde el momento en que sabemos que tiene grado, a lo sumo, n − 1; luego se podrá escribir f (λj ) = r(λj ) = n−1 X βk λkj (131) k=0 que constituye un sistema de n ecuaciones que nos permite encontrar los n coeficientes de r(λ). Y si f (A) se define por la misma serie de f (λ), entonces, aplicando nuevamente el teorema de Cayley-Hamilton, f (A) = Pn−1 q(A)p(A) + r(A) = r(A) = k=0 βk Ak , donde los βk se obtienen del sistema (131). Como ejemplo, calculemos sin(A), con A= " −3 1 0 −2 # (132) La ecuación caracterı́stica es p(λ) = (3 + λ)(2 + λ) = 0, y los valores propios λ1 = −3 y λ2 = −2. Como n = 2, a lo sumo r será un polinomio de primer grado. De aquı́: sin(λ1 ) = β0 + β1 λ1 sin(λ2 ) = β0 + β1 λ2 (133) Se sigue que β0 = 3 sin(−2) − 2 sin(−3) y β1 = sin(−2) − sin(−3). Entonces, simplemente, sin(A) = β0 + β1 A 82 (134) Por consiguiente, el cálculo de la función matriz exponencial es un caso particular a igual que lo es el cálculo de la función seno de una matriz. Por ejemplo, para la matriz A= " 0 1 −2 −3 # (135) la ecuación caracterı́stica es p(λ) = λ2 + 3λ + 2 = 0 y los valores propios λ1 = −1 y λ2 = −2. Sabemos que eAt = β0 I + β1 A (136) y obtenemos los coeficientes del sistema e−t = β0 − β1 e−2t = β0 − 2β1 (137) β0 = e−t β1 = e−t − e−2t (138) eAt = e−t I + (e−t − e−2t )A (139) f (λ) = q(λ)p(λ) + r(λ) (140) de donde con lo cual Queda por discutir el caso en que dos o más valores propios son iguales. En ese caso, algunas de las ecuaciones (131) serán iguales, y el sistema no será suficiente para determinar todos los coeficientes. Supongamos que un valor propio λi está repetido m veces. Eso significa que el polinomio caracterı́stico contendrá un factor (λ − λi )m . Si volvemos a y como las m − 1 derivadas primeras de (λ − λi )m son cero en λ = λi , se añaden a la ecuación anterior las m − 1 ecuaciones f ′ (λ) f ′′ (λ) ··· m−1 f (λ) = = = = 83 r′ (λ) r′′ (λ) ··· rm−1 (λ) (141) (evaluadas en λ = λi ). Estas ecuaciones, combinadas con el resto de f (λj ) = r(λj ) para j 6= i forman el conjunto requerido de n ecuaciones para las n incógnitas βk . Como ejemplo trivial, considérese la matriz A= " 2 3 0 2 # (142) de ecuación caracterı́stica p(λ) = (2 − λ)2 = 0. Los dos valores propios valen 2. La matriz exponencial es eAt = β0 I + β1 A (143) donde los coeficientes se siguen del sistema e2t = β0 + 2β1 te2t = β1 8 (144) Bibliografı́a Prácticamente, la única fuente en español para el estudio de los sistemas electro-mecánicos bajo el punto de vista de la mecánica de Lagrange es el excelente y en muchos aspectos no superado ”Dinámica de Lagrange”, de Dare A. Wells. 9 Resumen conceptual 1. Analogı́a entre sistemas mecánicos y eléctricos. 2. Necesidad de una formulación escalar de la mecánica. 3. Principio de D’Alembert y ecuaciones de Lagrange. 4. Energı́a cinética, potencial y función de Rayleigh para sistemas eléctricos. 5. Sistemas lineales. Teorema de Cayley-Hamilton y cálculo de la matriz exponencial. 84 10 Ejercicios 1. Escribir la energı́a cinética de una masa m que se mueve en el espacio tomando como coordenadas generalizadas las coordenadas polares de su posición. 2. Encontrar la energı́a cinética de una barra uniforme de longitud l y masa m que es lanzada al aire de forma arbitraria. 3. Escribir las funciones de Lagrange para los dos sistemas de la Figura 7. Figura 7 4. Un solenoide muy largo de sección circular, con N1 espiras por unidad de longitud, contiene en su interior otro solenoide circular, con N2 espiras por unidad de longitud, montado sobre apoyos lisos (sin rozamiento) que puede girar como se muestra en la Figura 8a. Al giro se opone un resorte espiral de constante k. Las bobinas se conectan a circuitos independientes, como se muestra en 8b. Si la inducción mutua entre bobinas es M12 = bπr2 N1 N2 sin θ = a sin θ siendo b y a ciertas constantes, demostrar que la Lagrangiana es 85 (145) Figura 8 L = 1 1 1 M11 q̇12 + M22 q̇22 + I θ̇2 2 2 2 1 +aq̇1 q̇2 sin θ + u1 q1 + u0 q2 sin ωt − kθ2 2 (146) y escribir las ecuaciones del movimiento. I es el momento de inercia del solenoide interior, y su energı́a cinética es (1/2)I θ̇2 . 5. Encontrar las ecuaciones del movimiento del sistema de la Figura 9, sabiendo que L(x) = N 2 µ0 siendo A el área transversal del núcleo. Figura 9 86 A x2 (147) IV La máquina simple 1 Motivación La máquina eléctrica más sencilla concebible consiste en un simple conductor en movimiento en un campo magnético. A pesar de su simplicidad, se muestran los elementos básicos que rigen el comportamiento de cualquier otra máquina, y de ahı́ el interés en estudiarla. 2 La máquina simple La máquina simple consiste en dos conductores paralelos entre los que puede establecerse una diferencia de potencial V. Un segmento conductor, que desliza sobre los anteriores y se dispone perpendicular a los mismos, cierra el circuito. El conjunto se considera sometido a la influencia de un campo magnético que en la Figura 1 hemos establecido como entrante al plano del dibujo. Figura 1 Veamos qué ocurre al establecer la diferencia de potencial V con el circuito cerrado, y para ello aislamos mentalmente un electrón. Al iniciarse la corriente, los electrones se mueve en sentido contrario al convencional de la intensidad, en nuestro caso de P a Q. Al hacerlo, el electrón experimenta una fuerza F̄1 = −e(ū × B̄). Como consecuencia, el segmento P Q inicia un movimiento hacia la derecha. Al moverse, adquire una velocidad v̄, y aparece la fuerza de Lorentz F̄2 = −e(v̄ × B̄) que está dirigida en sentido QP . Para el electrón del conductor, éste está en reposo, ası́ que interpreta la fuerza F̄2 87 como procedente de un campo Ēc en sentido P Q. Aparece en el conductor, de acuerdo con II.88, una fuerza electro-motriz E= Z Q P ĒC · d¯l (1) que se opone a V. Esta fuerza electro-motriz, que depende de Ēc , que depende de v̄, aumenta con v̄, hasta un punto en que ya no circulará corriente en el segmento P Q, al ser E = V e V −E (2) R Esta es una descripción semicualitativa, porque descansa en ū, que es la velocidad con que se mueve el electrón en el conductor al establecer V. Pero esa velocidad no se puede medir. También, porque el razonamiento se refiere a un único electrón, que puede aislarse mentalmente, pero no fı́sicamente. Lo que procede por tanto es pasar el razonamiento a un contexto macroscópico, con cantidades medibles. En primer lugar, para un pequeño segmento d¯l del conductor P Q, la fuerza que aparece al conectar V es i= dF̄1 = −ρdV (ū × B̄) (3) donde ρ es la densidad volúmica de electrones y el signo ’–’ indica carga negativa. Esto se puede poner dF̄1 = −dV (ρū × B̄) = −dSdl(j̄ × B̄) (4) dF̄1 = −jdS(d¯l × B̄) = −i(d¯l × B̄) (5) y como j̄ y d¯l son paralelos: e integrando desde P a Q, F̄1 = −i¯l × B̄ (6) Para nuestra geometrı́a, F1 = −ilB. Por otro lado Ēc , que es fuerza por unidad de carga, es una constante para toda la longitud del segmento P Q, ya que su valor es v̄ × B̄, ası́ que E= Z Q P Ēc · d¯l = lv̄ × B̄ (7) que para nuestra geometrı́a da E = lvB. Si al movimiento de P Q se opone una fuerza de naturaleza mecánica, F̄m , se alcanzará un cierto equilibrio cuando |F1 | = |Fm |: 88 |F̄1 | = |F̄m | = ilB = V −E lB R (8) y siendo E = lvB: VlB l2 B 2 − v R R La velocidad a la que se alcanza este equilibrio es |F̄1 | = |F̄m | = v0 = V R|Fm | − 2 2 lB l B (9) (10) A la velocidad de equilibrio ”en vacı́o”, es decir, cuando la máquina funciona sin resistencia mecánica, se le llama ”velocidad sincrónica”, y es V (11) lB En resumen: al suministrar corriente a la máquina mediante V, P Q comienza a moverse. El sistema funciona entonces como motor. El motor acelera su velocidad, y al hacerlo aumenta E. Si no hay resistencia, lo hace hasta el punto en que se compensa totalmente con V, y deja de circular corriente, puesto que vs = V −E (12) R se ha alcanzado entonces vs . Si hay fuerzas mecánicas que vencer, la velocidad que se alcanza es la dada por (10). Al representar F1 en función de la velocidad se obtiene una recta de ordenada en el origen VlB/R y pendiente −l2 B 2 /R, que será cortada en algún punto por la curva que represente a Fm . El punto de corte se produce precisamente a v0 . Como o bien Fm es una constante, o bien una función creciente de la velocidad, al aumentar V, que sólo afecta a la ordenada en el origen, se tiene una recta paralela a la original, pero desplazada hacia arriba. Entonces, el punto de corte con Fm se desplazará a la derecha, es decir, se incrementará la velocidad v0 . Por otro lado, cuando V = 0 y se usa una fuerza mecánica para desplazar al segmento P Q a una velocidad v, aparece una fuerza electromotriz inducida E y por tanto una corriente i= E R El sistema funciona entonces como generador. i= 89 (13) 3 Hacia el motor real En la sección anterior hemos tratado con el motor más sencillo que nos ha permitido ver la interrelación electro-magneto-mecánica. En esta nos acercamos más al funcionamiento de los motores reales, e introducimos nuevos conceptos. Sin embargo, seguiremos tratando con sistemas muy simples. El ”motor” más simple que puede concebirse es aún más simple que el de la sección anterior. Consiste en un imán que se mueve manualmente bajo la superficie de una mesa de madera o cristal. Sobre la misma se coloca otro imán. Se ve que al mover el imán bajo la mesa, éste arrastra al que está sobre ella. En terminologı́a de motores, la pieza que arrastra se llama estator, y la pieza arrastrada rotor. El estator se mueve algo por delante del rotor, pero ambos a la misma velocidad. A los motores en que ambas partes se mueven a la misma velocidad se les llama motores sı́ncronos. Es evidente también que se obtiene el mismo resultado si en el ejemplo anterior los imanes permanentes se sustituyen por electroimanes. Un sistema ası́, en el cual el estator se mueve linealmente se denomina motor sı́ncrono lineal, y se muestra en la Figura 2. Es importante el espacio de separación entre las dos piezas. A esta separación g se le llama con su nombre anglosajón, gap (Mind the gap!) y es un importante factor porque, como veremos, la mayor densidad de energı́a magnética se encuentra ahı́. La versión rotativa se muestra en la Figura 3. Los detalles constructivos de cómo se alimentan estator y rotor cuando no están fijos, sino girando, podemos omitirlos. Aquı́, la fuerza de arrastre del estator sobre el rotor depende del ángulo δ, en la forma Fm = Fmax sin δ (14) y es nula cuando δ = 0. En efecto, cuando ambas piezas están alineadas, la fuerza se dirige a lo largo del eje principal y el momento de giro que se ejerce sobre el rotor es nulo. Es máximo cuando δ = π/2. Desde un punto de vista general, entre la energı́a eléctrica que se suministra al motor y la energı́a mecánica que se obtiene, o al revés cuando se trata de un generador, lo que tenemos es el campo magnético. El campo magnético es el intermediario en la conversión energı́a mecánica ↔ energı́a eléctrica. 4 Energı́a del campo magnético Consideremos un sistema de dos partes, tal y como se muestra en la Figura 4. La parte que llamamos ”primaria” se alimenta con una corriente i1 , y 90 Figura 2 Figura 3 permanece fija. La parte que llamamos ”secundaria” es móvil, y se encuentra separada por una distancia g de la primaria. Supongamos que incrementamos en el primario la intensidad desde 0 a un valor i1 . Como consecuencia, el flujo magnético en el interior del primario aumenta desde 0 a Φ1 . Como Φ1 depende del número de vueltas del cable alrededor del primario, n, pongamos Φ1 = nΦ = λ. En un caso ideal λ es proporcional a i (véase por ejemplo II.99), con constante de proporcionalidad L. En un caso real la relación no es lineal, sino que se parece a la de la Figura 5. En el circuito del primario sabemos que u1 = Ri + L La potencia eléctrica suministrada es 91 di dt (15) Figura 4 Figura 5 92 Figura 6 dWe di = u1 i = Ri2 + Li (16) dt dt El incremento de energı́a eléctrica suministrada a la bobina que rodea al primario es Pe = di dt = Lidi = idλ (17) dt Este incremento se transforma en energı́a magnética, Wb , de forma que dWe = dWb . Volviendo a la Figura 5, dWe es la banda rayada en negro. La zona rayada en amarillo representa la energı́a suministrada a la bobina, que es dWe = Li We = Z λ1 0 idλ (18) Es útil visualizar el flujo magnético como una ”corriente” que circula enlazando primario y secundario. Y es evidente que esta corriente se interrumpe si g se hace muy grande. Si se incrementa un poco, habrá que incrementar i en el primario para mantener el mismo flujo, lo cual significa que la curva λ(i) se hace más plana, aproximándose a la lı́nea recta, como se muestra en la Figura 6. El gap es una especie de resistencia al flujo, que se vence aumentando la intensidad, de la misma forma que en un circuito eléctrico una resistencia R limita la corriente eléctrica, y ésta se puede mantener aumentando el voltaje. Ası́ que, llegados a este punto, se puede hacer un paralelismo entre los circuitos eléctricos y los circuitos magnéticos: 93 Figura 7 Circuito eléctrico Corriente i Voltaje u Resistencia R Ley de Ohm: i = u/R Circuito magnético Flujo Φ Fuerza magneto-motriz ni Reluctancia Rm Ley de Ohm: Φ = in/Rm El paralelismo se puede llevar más lejos aún, pues sabemos que la resistencia eléctrica (II.83) tiene la forma l (19) σA donde A es la sección del conductor, l su longitud y σ la inversa de la resistividad. En un circuito magnético, R= Rm = l µA (20) donde l es su longitud, A su sección y µ la permeabilidad magnética. Este planteamiento se puede considerar fenomenológico: se observa un efecto, que se relaciona con una causa, y, como es costumbre, se supone la relación más sencilla posible útil para explicar las observaciones. En nuestro caso, el efecto es el flujo magnético, y la causa es la intensidad que circula por el primario. La relación más sencilla es lineal, y la hemos escrito como Φ = ni/Rm . Con esto, el sistema de la Figura 4 lo podemos representar como un circuito magnético, tal como el de la Figura 7, donde Fb es la fuerza magnetomotriz, Rc y Rg las reluctancias del núcleo y del gap y Φ el flujo magnético. Sabemos que Φ = BA, donde A es la sección transversal del circuito y que 94 Figura 8 ni = Rm Φ = Hl (21) ası́ que, en relación con el circuito de la Figura 7, escribimos ni = Hc lc + Hg lg (22) y como λ = nΦ = nBA, tenemos (Hc lc + Hg lg ) nAdB n en el gap, Hg = B/µ0 , y efectuando la integración Wb = Wb = V c Z Z idλ = Z Hc dB + Vg B2 = wbc Vc + wbg Vg 2µ0 (23) (24) donde Vc y Vg son los volúmenes del núcleo y del gap y wbc y wbg son las densidades de energı́a respectivas. En el caso en que el núcleo sea lineal, Hc = Bc /µc . Volvamos a la Figura 4. Si el secundario se encuentra en la posición x1 y pasa a la posición x2 , reduciendo el gap, en igualdad de las demás condiciones la curva caracterı́stica pasa de λ(x1 ) a λ(x2 ). En el proceso, el incremento en la energı́a eléctrica ha sido dWe = i(λ2 − λ1 ) (25) que se corresponde con el área abcd de la Figura 8. El incremento en la energı́a del campo es la diferencia entre las áreas obc y oad. Como ha sido preciso ejercer una cierta fuerza para mover el secundario desde x1 a x2 , se ha realizado un trabajo mecánico también, ası́ que el incremento dWe se ha 95 invertido en dWb + dWm , donde Wm es el trabajo mecánico. En la Figura 8, llamemos a1 al área cbed, a2 a bae, a3 a deo y a4 a eao. Como dWe = a1 + a2 y dWb = a1 + a3 − a4 − a3 = a1 − a4 , se sigue de dWe = dWb + dWm que dWm = a2 + a4 , que es la zona rayada en la Figura. Es útil introducir aquı́ el concepto de co-energı́a. En la Figura 5, la co-energı́a es el área bajo la curva λ(i). La llamamos Wb′ , de forma que Wb + Wb′ = iλ. En términos de co-energı́a, vemos que dWm = dWb′ , y si dWm se ha producido por la acción de una fuerza f en el incremento dx, entonces f dx = dWb′ , lo cual quiere decir que ∂Wb′ (26) ∂x y este es el enlace entre la fuerza mecánica y el campo eléctrico, ya que Wb′ depende a través de la curva λ(i) de la energı́a eléctrica suministrada mediante i. Aquı́ se ve cuantitativamente lo que afirmábamos antes: que el campo magnético es el intermediario en la conversión de energı́a mecánica en eléctrica y viceversa. Una vez introducidos todos los elementos necesarios, volvemos al sistema lineal de la Figura 2. Despreciamos la reluctancia del núcleo y asumimos comportamiento lineal, con λ = Li; como además f= λ = nΦ = n ni n2 Aµ0 i = Rm g (27) n2 Aµ0 g (28) se sigue que L= es decir, que L depende del gap y es por tanto una función de x: λ = L(x)i, de donde calculamos la co-energı́a: 1 λdi = L(x)i2 2 0 Ahora podemos calcular la fuerza magnética sobre el secundario: Wb′ = Z i (29) 1 dL(x) ∂ 1 L(x)i2 = i2 (30) ∂x 2 2 dx Nótese que, si el sistema es lineal, entonces Wb = Wb′ : energı́a y co-energı́a son iguales. Podemos usar los resultados anteriores para calcular la fuerza de arrastre del estator sobre el rotor en el motor sı́ncrono lineal. Ahora g depende del retraso que lleve el rotor respecto al estator. Se comprende entonces que si fb = 96 el ”rotor” es infinitamente largo, no importa lo intenso que sea el campo del estator que no se generará ningún arrastre. 4.1 Corrientes en estator y rotor Ampliemos los razonamientos anteriores al caso en que circula corriente también por el secundario. Suponemos que ambas partes están en reposo y que la energı́a eléctrica suministrada se almacena en el campo magnético. Entonces dWb = dWe = e1 i1 dt + e2 i2 dt = i1 dλ1 + i2 dλ2 (31) Si el sistema es lineal: λ1 = L1 i1 + L12 i2 λ2 = L12 i1 + L2 i2 (32) y en estos sabemos que la energı́a es igual a la co-energı́a, luego 1 1 λ1 di1 + λ2 di2 = L1 i21 + L2 i22 + L12 i1 i2 (33) 2 2 0,0 Nótese cómo esta expresión es un caso particular de III.58. De aquı́ Wb = Wb′ = Z i1 ,i2 ∂Wb′ 1 dL1 1 2 dL2 dL12 = i21 + i2 + i1 i2 (34) ∂x 2 dx 2 dx dx Si reunimos las ecuaciones para la parte eléctrica y para la parte mecánica, teniendo en cuenta la presencia de las dos corrientes y la inducción mutua, tenemos, para la parte eléctrica: fb = dλ1 dt dλ2 = i2 R 2 + dt u1 = i 1 R 1 + u2 (35) donde ∂λ1,2 /∂t son las fuerzas electromotrices inducidas. Para la parte mecánica, si m es la masa que ha de moverse: d2 x dx − fr (36) = f − β m dt2 dt donde fm es la fuerza magnética, fr una resistencia a vencer (la máquina se construye precisamente para vencer la resistencia fr ) y el término βdx/dt m 97 la fricción que se opone al movimiento. En cuanto a las derivadas, si el sistema es lineal: dλ1 d d = e1 = (L1 (x)i1 ) + (L12 (x)i2 ) dt dt dt di1 dL1 dx di2 dL12 dx = L1 (x) + i1 + L12 + i2 dt dx dt dt dx dt (37) con una expresión similar para λ2 . Y en cuanto a fm , es la derivada de la co-energı́a, que es igual a la energı́a si el sistema es lineal. 5 Motores rotatorios sencillos Si vamos a la definición de fuerza generalizada en III.9: Qj = X j F̄i · ∂r̄i ∂qj (38) vemos que la fuerza generalizada que corresponde a una coordenada generalizada angular tiene dimensiones de fuerza por distancia, es decir, de par. Pero en III.17 vemos que Qj tiene a su vez las mismas dimensiones que ∂T /∂qj . Luego la derivada de una energı́a respecto a una variable angular es un par. Como la energı́a y la co-energı́a tienen las mismas dimensiones, se concluye que el par entregado por una máquina rotatoria es ∂Wb′ Π= ∂θ (39) En general, será dL12 1 dL1 1 2 dL2 + i2 + i1 i2 (40) Π = i21 2 dθ 2 dθ dθ En el sistema de la Figura 9, la autoinducción L1 no depende de la posición del rotor, luego para esto motor: 1 dL2 dL12 Π = i22 + i1 i2 (41) 2 dθ dθ En un motor en el que el estator y el rotor son cilı́ndricos y por construcción las autoinducciones son independientes del ángulo θ del rotor respecto a una dirección de referencia, no hay más que término de inducción mutua, y el par es 98 Figura 9 dL12 (42) dθ con L12 = M cos θ si M es el pico de inducción mutua, que se alcanza cuando están alineados los ejes magnéticos del estator y del rotor y θ es el ángulo que forman ambos ejes. Se entiende entonces que como dirección de referencia se toma el eje magnético del estator. Si las corrientes son Π = i1 i2 i1 = I1 cos ω1 t i2 = I2 cos(ω2 t + α) (43) θ = ωm t + δ (44) y donde ωm es la velocidad angular del rotor y δ es la posición del rotor en t = 0, entonces Π = −I1 I2 M cos ω1 t cos(ω2 t + α) sin(ωm t + δ) (45) Hay dos casos prácticos: a) ω2 = 0, α = 0, ω1 = ωm . El estator se alimenta con corriente alterna y el rotor con corriente continua. El rotor gira a la misma frecuencia angular a la que se excita el primario. Estos son los motores monofásicos sincrónicos. Particularizando: Π = −I1 I2 M cos ω1 t sin(ω1 t + δ) 99 (46) Aplicando la identidad trigonométrica sin x cos y = 1 1 sin(x + y) + sin(x − y) 2 2 (47) tenemos I1 I2 M [sin(2ω1 t + δ) + sin δ] 2 El promedio del primer término es nulo, y queda sólo el segundo: Π=− I1 I2 M sin δ 2 Se ve que el promedio es máximo cuando δ = π/2. Πm = − (48) (49) b) ωm = ω1 − ω2 . La frecuencia angular del rotor no coincide ni con la de excitación del estator ni con la del rotor. Por esta razón estos motores se llaman monofásicos asincrónicos. Aplicando la misma identidad trigonométrica que hemos usado antes dos veces podemos poner la expresión general para el par como la suma de cuatro términos sinusoidales. En efecto: 1 1 sin[(ωm + ω2 )t + α + δ] + sin[(ωm − ω2 )t + δ − α] 2 2 (50) y ahora desarrollamos el producto de cada uno de ellos por cos ω1 t y obtenemos los cuatro términos: sin(ωm t + δ) cos(ω2 t + α) = 1 sin[(ωm + ω1 + ω2 )t + α + δ] + 4 1 sin[(ωm − ω1 + ω2 )t + α + δ] + 4 1 sin[(ωm + ω1 − ω2 )t − α + δ] + 4 1 sin[(ωm − ω1 − ω2 )t − α + δ] (51) 4 de los cuales, el único cuyo promedio temporal es distinto de cero es el segundo, resultando I1 I2 M sin(α + δ) (52) 4 Se observa también que cuando ωm = 0 el par medio es cero: el motor necesita ser llevado en un proceso de arranque a una ωm 6= 0 para que pueda dar par. Πm = − 100 6 Ecuaciones generales Recapitulamos los resultados más importantes y agrupamos las ecuaciones relevantes. Consideramos la parte eléctrica y la parte mecánica. Para la parte eléctrica, el voltaje suministrado a estator y rotor se iguala con la caı́da de potencial en las resistencias y la fuerza electro-motriz inducida. Esta última viene dada por la derivada temporal del flujo λ, que es esencialmente el flujo debido a una espira por el número de espiras: λ = nΦ. En los modelos lineales λ es una función lineal de la intensidad i. Esta relación funcional λ(i), sea lineal o no, permite encontrar la co-energı́a Wb′ , de donde por derivación encontramos las fuerzas y pares magnéticos: Wb′ = Z λ(i)di; fm = ∂Wb′ ∂q ! (53) donde q puede representar una coordenada lineal, o angular. El procedimiento es más sencillo cuando λ(i) es lineal. Si escribimos: λ1 = L1 i1 + L12 i2 λ2 = L12 i1 + L2 i2 (54) tenemos, cuando los coeficientes de inducción dependen del giro θ del rotor: dλ1 di1 dL1 = L1 + i1 ωm dt dt dθ di2 dL12 +L12 + i2 ωm dt dθ di1 dL12 dλ2 = +L12 + ii ωm dt dt dθ dL2 di2 + i2 ωm +L2 dt dθ (55) En cuanto a la parte mecánica, dado que la única parte móvil es el rotor: dθ d2 θ + β + Πl (56) 2 dt dt donde Π es el par aplicado, y depende del tipo de motor y la forma de alimentarlo, como hemos visto en la sección anterior, β el coeficiente de rozamiento y Πl la carga que el motor ha de vencer. Π=J 101 7 Bibliografı́a Hemos seguido aquı́ más o menos ”Electromechanical energy conversion”, de Ernest Mendrela. Como se ve, todo depende de dos puntos: a) la existencia de una relación λ(i), que si es lineal facilita mucho el análisis, y b) la posibilidad de calcular los coeficientes de autoinducción e inducción mutua Lij . Este punto se puede estudiar, por ejemplo, en ”Campos y ondas electromagnéticos” de P. Lorrain y D.R. Corson. En la página 368 y siguientes de la edición española se pueden encontrar algunos ejemplos para geometrı́as sencillas. 8 Resumen conceptual 1. Se plantea y discute la máquina simple, y se introducen la velocidad de equilibrio y la velocidad sincrónica, ası́ como los regı́menes de generador y motor. 2. Motores sincrónicos con diseño lineal y rotatorio. 3. Se introduce un modelo sencillo de primario-secundario y se analiza el balance energético. Se introduce la relación λ(i) y se estudia la influencia del ”gap”. Se introducen los circuitos magnéticos. 4. Energı́a y co-energı́a. 5. Ecuaciones generales para el modelo primario-secundario anterior cuando circula intensidad por las dos partes. Ecuaciones de la parte eléctrica y de la parte mecánica. 6. Obtención del par como derivada de la co-energı́a. 7. El motor rotatorio monofásico sincrónico y asincrónico. 8. Ecuaciones generales. 9 Ejercicios Los siguientes ejercicios están tomados de Fitzgerald, ”Electromechanical energy conversion principles”, capı́tulo 3 de ”Electric machinery”. 1. Sea un rotor cilı́ndrico de 30 cm de longitud y 5 cm de radio (Figura 10). Este rotor se encuentra en un campo magnético uniforme B̄ de 102 Figura 10 Figura 11 0.02T que es perpendicular al eje del rotor. En la superficie del mismo, siguiendo lı́neas paralelas al eje diametralmente opuestas, hay dos conductores por los que circulan corrientes de sentidos opuestos de 10A. Si α es el ángulo que forma la lı́nea AB con el eje x, demostrar que el par que experimenta el rotor es Π = −0.006 sin α N ·m (57) 2. En el dispositivo de la Figura 11, calcular la energı́a magnética almacenada en el ”gap” suponiendo que N = 1000 vueltas, i = 10 A, g = 2.0 mm d = 0.15 m y l = 0.1 m. Se supone que la permeabilidad magnética del núcleo tiende a ∞. Solución: de (27) y (29) Wb′ = 236(1 − x/d) J. 3. La inductancia de un solenoide fue medida en varias posiciones a lo 103 largo del eje x, resultando la tabla siguiente: x cm 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0 L(x) 2.80 2.26 1.78 1.52 1.34 1.26 1.20 1.16 1.13 1.11 1.10 Para i = 0.75 A, encontrar la fuerza que experimenta el solenoide. Sugerencia: usando polyfit de Matlab ajustar un polinomio (de cuarto orden es suficiente), de forma que se pueda expresar L(x) = a0 + a1 x + a2 x2 + a3 x3 + a4 x4 y luego calcular la fuerza usando (30). 4. En el sistema de la Figura 12, el rotor es ovalado, lo que hace que el ”gap” sea variable. Cuando el eje del rotor forma un ángulo θ con el eje del estator, L(θ) = L0 + L1 cos(2θ), con L0 = 10.6 mH y L1 = 2.7 mH. Demostrar que para una corriente de 2 A, el par que experimenta el rotor es 1 Π(θ) = i2 (−2L1 sin θ) = −1.08 × 10−2 sin(2θ) 2 N ·m (58) 5. En el segundo problema, si i(x) = i0 (x/d) A, demostrar que la fuerza actuante sobre la pieza móvil es f =− i0 µ 0 N 2 l 4g 2 x d N (59) Encontrar la co-energı́a y comprobar que si calculamos la fuerza a partir de ella como f= ∂Wb′ ∂x no obtenemos el resultado (59), que proviene de (30). ¿Por qué? 104 (60) Figura 12 Figura 13 6. En el sistema de la Figura 13, calcular el par sobre el rotor como una función de θ. La longitud del rotor es h = 1.8 cm, con r1 = 2.5 cm y g = 3 mm. Se supone que la reluctancia del núcleo y del propio rotor es nula, con lo que la energı́a magnética se encuentra en el ”gap”, cuyo volumen depende del ángulo θ. El flujo máximo a través del ”gap” está limitado a 1.65 T, para evitar saturación. Sugerencia: obtener una expresión para el volumen del ”gap” y tomar de (24) la densidad de energı́a magnética. Luego obtener el par derivando respecto a θ. 105 V La máquina generalizada 1 Motivación El objeto de este capı́tulo es generalizar los resultados del anterior, presentando un modelo generalizado de máquina rotatoria, del cual los distintos tipos de máquinas son casos particulares. Al hacerlo, plantearemos un sistema de seis ecuaciones diferenciales no lineales cuya resolución nos da la evolución temporal de las variables eléctricas y mecánicas. 2 La máquina rotatoria generalizada En general, las máquinas eléctricas tienen diseños rotatorios. El estator es una carcasa cilı́ndrica, fija, y en su interior y concéntrico con él gira el rotor, sujeto a un eje que se apoya en rodamientos. Hay varias razones para este tipo de diseño, unas teóricas y otras prácticas. Si vamos a la Figura 1 de IV, vemos que la fuerza magnética sobre un conductor y el campo inducido son máximos cuando la velocidad v̄ del movimiento del conductor, el campo magnético y el elemento de corriente son mutuamente perpendiculares. En el diseño cilı́ndrico por tanto es preciso hacer que el campo magnético sea perpendicular al movimiento del rotor, y como el movimiento del rotor es circular, se sigue que el campo ha de ser radial, o lo más cercano a eso que se pueda conseguir. Por otro lado, como ∇ · B̄ = 0, si aplicamos el teorema de la divergencia al cilindro del rotor, la integral de superficie B̄ · dS̄ será nula. Esto significa que habrá tantas lı́neas entrantes como salientes en el cilindro. Esto significa a su vez que si hacemos un recorrido que dé la vuelta al cilindro, desde ϕ = 0 hasta ϕ = 2π y registramos B̄ como función de ϕ, ha de ocurrir: 1) que en la gráfica correspondiente el área bajo el eje ϕ sea igual al área sobre la misma; 2) que B̄ sea función periódica de ϕ. Una representación de las lı́neas de campo es la de la Figura 1. El punto en que B̄ entra perpendicularmente a la sección normal al cilindro se denomina ”polo sur”, y el punto en que B̄ sale perpendicularmente ”polo norte”. Al ser B̄ periódico, lo será cualquiera de sus componentes, luego se podrá escribir como un desarrollo en serie de Fourier, luego podemos hacer el análisis para la frecuencia fundamental. Si la componente principal de B̄ es sinusoidal, esto significa que existen dos ejes, que llamaremos α y β, perpendiculares entre sı́, de forma que B̄ = B̄α + B̄β , como muestra la Figura 2. Es decir, que B̄ se puede conseguir como superposición o suma vectorial de dos 106 Figura 1 Figura 2 campos perpendiculares. Entonces, el campo creado por el estator se puede representar por dos bobinas mutuamente perpendiculares, cuyos campos, al variar en el tiempo, hacen rotar a B̄ en el plano (α, β). Con un razonamiento similar para el campo del rotor, podemos modelar la máquina rotatoria como un sistema de dos pares de campos creados por dos pares de bobinas, como se muestra en la Figura 3, alimentadas por intensidades (ieα , ieβ , irα , irβ ) donde los subı́ndices ’e’ y ’r’ significan respectivamente ”estator” y ”rotor”. Colineal con el eje común a ambos cilindros está el eje mecánico, que se mueve con velocidad angular θ (la del rotor). Si escribimos en forma vectorial las relaciones entre λ e i, poniendo λ̄ = Lī, donde 107 Figura 3 λeα λeβ λrα λrβ (1) ieα ieβ irα irβ (2) λ̄ = e ī = y L es la matriz de inducciones, tenemos para la parte eléctrica d dλ̄ = Rī + (Lī) (3) dt dt donde R es la matriz de resistencias. Como la resistencia en el circuito que alimenta a la bobina j depende sólo de la intensidad que circula por ese circuito, la matriz R es diagonal. Por otro lado ū = Rī + dī dL d (Lī) = L + θ̇ī dt dt dθ Ahora, calculamos la co-energı́a 108 (4) Wc′ = Z C λ̄ · dī = Z ī 0̄ Lī′ dī′ (5) donde el camino de integración lleva desde ī′ = 0̄ hasta ī′ = ī. Como L no depende de las intensidades, 1 Wb′ = īT Lī 2 Y, finalmente, el par entregado por el motor es 1 dL ∂Wb′ = īT · · ī Π= ∂θ 2 dθ 2.1 (6) (7) La matriz de inductancias Falta darle forma a la matriz L. Los coeficientes no dependen de las intensidades, sino de la geometrı́a. Se puede ver esto considerando dos casos extremos. En el primero tenemos dos bobinas situadas en planos paralelos. El flujo que atraviesa una de ellas debido a la corriente que circula por la otra, es máximo. Pero si las bobinas están en planos perpendiculares, el flujo que atraviesa una de ellas es debido a la corriente que circula por la otra es mı́nimo, como se ve en la Figura 4. Figura 4 Con esto en mente, se ve que en la matriz L: 1) los elementos diagonales son constantes, ya que la autoinducción de una bobina no depende de su 109 orientación respecto a otros cuerpos; 2) la influencia entre las bobinas del rotor es mı́nima, ya que son perpendiculares. En nuestro modelo, damos a estos elementos el valor 0; 3) Las inducciones mutuas de una bobina del estator (rotor) con las otras dos del rotor (estator) dependen del coseno del ángulo que forman (para que sea máxima si este ángulo es cero y mı́nima si es de π/2). En definitiva: L= Lee 0 Ler cos θ −Ler sin θ 0 Lee Ler sin θ Ler cos θ er er L cos θ L sin θ Lrr 0 er er −L sin θ L cos θ 0 Lrr (8) donde hemos supuesto además que las dos bobinas del estator son iguales y que las dos bobinas del rotor también son iguales (L11 = L22 y L33 = L44 ). A partir de aquı́ calculamos: dL = dθ 0 0 −Ler sin θ −Ler cos θ 0 0 Ler cos θ −Ler sin θ −Ler sin θ Ler cos θ 0 0 −Ler cos θ −Ler sin θ 0 0 y el par es entonces (9) ∂Wc′ dL Π = = īT · · ī ∂θ dθ = [ieα ieβ irα irβ ] 0 0 −Ler sin θ −Ler cos θ 0 0 Ler cos θ −Ler sin θ −Ler sin θ Ler cos θ 0 0 −Ler cos θ −Ler sin θ 0 0 = Ler sin θ(−ieα irα − ieβ irβ ) + Ler cos θ(−ieα irβ + ieβ irα ) ieα ieβ irα irβ (10) Debido a los productos cruzados, si las corrientes del estator son nulas, o las corrientes del rotor son nulas, entonces Π = 0. Además, si las corrientes son todas constantes, el par serı́a Π = Ler (p sin θ + q cos θ) (11) con p y q constantes, cuya media en una revolución completa es nula. Por tanto, un motor no puede funcionar si por sus bobinas circula sólo corriente continua. En general, calculamos el par promedio en una vuelta como 110 1 Z 2π er L (j1 sin θ + j2 cos θ)dθ Π= 2π 0 donde j1 = −ieα irα − ieβ irβ y j2 = −ieα irβ + ieβ irα . 3 (12) Planteamiento y solución numérica del problema Las ecuaciones que determinan el movimiento del sistema son entonces: ū = Rī + L J dī dL + θ̇ ī dt dθ d2 θ dθ = Π − Πr − β 2 dt dt (13) siendo Πr el par resistente que se ha de vencer mediante Π y β el coeficiente de fricción. Π viene dado por Π= ∂Wb′ ∂θ (14) y a su vez 1 (15) Wb′ = īT Lī 2 La primera ecuación es una ecuación vectorial con cuatro componente escalares. La segunda ecuación, por ser de segundo orden, se puede desdoblar en dos ecuaciones de primer orden. El acoplamiento entre la parte eléctrica y la parte mecánica viene a) por el hecho de que L es función de θ y b) en la parte mecánica, el par Π es función de las corrientes. Juntas las partes eléctrica y mecánica forman un sistema de seis ecuaciones diferenciales no lineales de primer orden. Introduzcamos las variables de estado: x̄ = x1 = ieα x2 = ieβ x3 = irα x4 = irβ x5 = θ x6 = θ̇ y en función de ellas, nuestro sistema: 111 (16) ueα = Rαe x1 + Lee ẋ1 + Ler ẋ3 cos x5 − Ler ẋ4 sin x5 −Ler x3 x6 sin x5 − Ler x4 x6 cos x5 ueβ = Rβe x2 + Lee ẋ2 + Ler ẋ3 sin x5 + Ler ẋ4 cos x5 Ler x3 x6 cos x5 − Ler x4 x6 sin x5 urα = Rαr x3 + Ler ẋ1 cos x5 + Ler ẋ2 sin x5 + Lrr ẋ3 −Ler x1 x6 sin x5 + Ler x2 x6 cos x5 urβ = Rβr x4 − Ler ẋ1 sin x5 + Ler ẋ2 cos x5 + Lrr ẋ4 −Ler x1 x6 cos x5 − Ler x2 x6 sin x5 ẋ5 = x6 Ler Ler (−x1 x3 − x2 x4 ) sin x5 + (−x1 x4 + x2 x3 ) cos x5 ẋ6 = J J Πr − − βx6 J (17) El problema con este sistema, escrito tal como está, es que los métodos numéricos habituales, por ejemplo los métodos de Runge-Kutta, tratan con sistemas de ecuaciones donde cada ecuación es de la forma ẋi = fi (x1 , x2 , · · ·). A esta forma se ajustan las dos últimas ecuaciones, pero no las cuatro primeras, donde aparecen combinaciones de las derivadas. Para reescribir las cuatro primeras ecuaciones en forma adecuada, vemos que, tal y como están, se pueden reordenar en la forma Lee 0 Ler cos x5 −Ler sin x5 0 Lee Ler sin x5 Ler cos x5 er er L cos x5 L sin x5 Lrr 0 er er −L sin x5 L cos x5 0 Lrr ẋ1 ẋ2 ẋ3 ẋ4 = f1 f2 f3 f4 (18) donde f1 f2 f3 f4 = = = = ueα − Rαe x1 + Ler x3 x6 sin x5 + Ler x4 x6 cos x5 ueβ − Rβe x2 − Ler x3 x6 cos x5 + Ler x4 x6 sin x5 urα − Rαr x3 + Ler x1 x6 sin x5 − Ler x2 x6 cos x5 urβ − Rβr x4 + Ler x1 x6 cos x5 + Ler x2 x6 sin x5 (19) Entonces, las cuatro primeras ecuaciones, escritas en la forma adecuada para su resolución numérica aparecen como 112 ẋ1 ẋ2 ẋ3 ẋ4 = Lee 0 Ler cos x5 −Ler sin x5 ee 0 L Ler sin x5 Ler cos x5 Ler cos x5 Ler sin x5 Lrr 0 er er −L sin x5 L cos x5 0 Lrr −1 f1 f2 f3 f4 (20) La inversa de la matriz existe siempre que se cumpla la condición de que Ler Ler 6= Lee Lrr , y viene dada por 1 er er L L − Lee Lrr −Lrr 0 Ler cos x5 −Ler sin x5 0 −Lrr Ler sin x5 Ler cos x5 Ler cos x5 Ler sin x5 −Lee 0 er er −L sin x5 L cos x5 0 −Lee (21) Ahora ya podemos escribir un sistema adecuado para su resolución numérica: Lrr Ler Ler f1 + f3 cos x5 − f4 sin x5 ∆ ∆ ∆ Lrr Ler Ler − f2 + f3 sin x5 + f4 cos x5 ∆ ∆ ∆ Ler Lee Ler f1 cos x5 + f2 sin x5 − f3 ∆ ∆ ∆ Ler Ler Lee − f1 sin x5 + f2 cos x5 − f4 ∆ ∆ ∆ f5 f6 ẋ1 = − ẋ2 = ẋ3 = ẋ4 = ẋ5 = ẋ6 = (22) donde hemos introducido ∆ = Ler Ler − Lee Lrr f 5 = x6 Ler Ler f6 = (−x1 x2 − x2 x4 ) sin x5 + (−x1 x4 + x2 x3 ) cos x5 J J Πr − βx6 − J 3.1 (23) Método de Runge-Kutta de cuarto orden Existen muchos tratados de cálculo numérico donde se explican los métodos de integración de sistemas de ecuaciones diferenciales. Aquı́ damos la explicación de uno de estos métodos, probablemente el más popular, no por 113 añadir nada a lo ya escrito en otros lugares, sino por hacer estas notas en lo posible auto-contenidas y facilitar el camino al estudiante. El método de Runge-Kutta de cuarto orden es un método popular, sencillo de programar, relativamente rápido y en la mayor parte de las ocasiones de suficiente precisión, que permite resolver sistemas de ecuaciones diferenciales de primer orden de la forma: ẋ1 ẋ2 ẋ3 .. . = f1 (x1 , x2 , · · ·) = f2 (x1 , x2 , · · ·) = f3 (x1 , x2 , · · ·) . = .. (24) No vamos a discutir la forma en que se obtiene dicho método, sino simplemente describir el algoritmo. Antes de eso, conviene aclarar la naturaleza de todos estos métodos. Una integración numérica no nos proporciona la función x(t), sino una serie de valores de x para instantes t1 , t2 , t3 ...tn . Aunque existen métodos de paso variable donde los intervalos ti+1 − ti dependen de i, en la mayorı́a de las ocasiones, para todos los i, la diferencia ti+1 −ti es una constante h, de manera que si partimos desde un instante inicial t0 , ti = t0 + ih. Todos estos métodos requieren el conocimiento de un estado inicial a partir del cual calcular estados sucesivos. En primer lugar, para ecuaciones simples de la forma ẋ = f (x, t). El método de Runge-Kutta parte de un valor xk (indicamos ası́ x(tk )) y calcula el valor xk+1 . Si fijamos h (por ejemplo, h = 0.1 cuando deseamos conocer x de décima en décima de segundo) el algoritmo sigue los siguientes pasos: 1. Calcular k1 = hf (xk , tk ) 2. Calcular k2 = hf (xk + k1 /2, tk + h/2) 3. Calcular k3 = hf (xk + k2 /2, tk + h/2) 4. Calcular k4 = hf (xk + k3 , tk + h) 5. Calcular xk+1 = xk + 61 [k1 + 2k2 + 2k3 + k4 ] En general, los sistemas dinámicos vienen descritos no por una sola variable, sino por varias. Por consiguiente, necesitamos generalizar el algoritmo para el caso en que queremos integrar no una ecuación sino un conjunto de ellas. Daremos el algoritmo explı́cito para un sistema de dos ecuaciones. 114 La generalización para un número cualquiera es inmediata y se deja como ejercicio al lector. Sea el sistema: ẋ = f (x, y, t) ẏ = g(x, y, t) (25) Dados unos valores xk e yk , el algoritmo sigue los siguientes pasos: 1. Calcular k1 = hf (xk , yk , tk ) 2. Calcular n1 = hg(xk , yk , tk ) 3. Calcular k2 = hf (xk + k1 /2, yk + n1 /2, tk + h/2) 4. Calcular n2 = hg(xk + k1 /2, yk + n1 /2, tk + h/2) 5. Calcular k3 = hf (xk + k2 /2, yk + n2 /2, tk + h/2) 6. Calcular n3 = hg(xk + k2 /2, yk + n2 /2, tk + h/2) 7. Calcular k4 = hf (xk + k3 , yk + n3 , tk + h) 8. Calcular n4 = hg(xk + k3 , yk + n3 , tk + h) 9. Calcular xk+1 = xk + 61 [k1 + 2k2 + 2k3 + k4 ] 10. Calcular yk+1 = yk + 16 [n1 + 2n2 + 2n3 + n4 ] 4 Transformación de coordenadas Es evidente la complejidad del sistema de ecuaciones anterior, lo que motiva a la búsqueda de una transformación que conduzca a un sistema más sencillo. En general, buscamos una transformación lineal definida por una matriz A, de forma que, en función de nuevas corrientes j̄ y tensiones v̄, las originales se puedan escribir como ī = Aj̄ y ū = Av̄. Impondremos la condición de que la potencia eléctrica suministrada al sistema no dependa de la transformación, es decir P = īT ū = j̄ T AT Av̄ = j̄ T v̄ (26) lo que implica que ha de ser AT A = I, es decir, que la matriz traspuesta de A coincida con la inversa, lo cual sabemos que es cierto, en particular, 115 para las matrices de rotación. Procedemos a escribir en función de las nuevas variables las ecuaciones para la parte eléctrica: Av̄ = RAj̄ + θ̇ dL dA dj̄ Aj̄ + L θ̇j̄ + LA dθ dθ dt (27) o dL dA dj̄ Aj̄ + θ̇A−1 L j̄ + A−1 LA dθ dθ dt Introduciendo las nuevas matrices v̄ = A−1 RAj̄ + θ̇A−1 R′ = A−1 RA L′ = A−1 LA dA H = A−1 L dθ dL T = A−1 A dθ (28) (29) la parte eléctrica se escribe como dj̄ + θ̇ (H + T) j̄ (30) dt En cuanto a la parte mecánica, la única parte afectada es el par Π, que se escribe en función de las nuevas variables como v̄ = R′ j̄ + L′ 1 dL 1 1 dL Π = īT Aj̄ = j̄ T Tj̄ ī = j̄ T AT (31) 2 dθ 2 dθ 2 Como se ve, todo depende de la elección de la matriz A. ¿De dónde proviene la complejidad de la máquina? Proviene de la dependencia de L con θ, y en última instancia del giro del rotor. Es obvio que un ”motor” en que el rotor estuviese en reposo, al igual que el estator, serı́a mucho más sencillo. Con esta guı́a, elegiremos la matriz A como una matriz de giro que compense el giro del rotor, de tal forma que, en el nuevo sistema, el rotor se encuentre fijo y sus ejes sean colineales con los del estator. La matriz de transformación, de dimensiones 4 × 4, ha de dejar inalterados los valores de corrientes y tensiones del estator. Como habı́amos tomado ī = ieα ieβ irα irβ 116 (32) la matriz A se puede particionar como A= " I 0 0 Ar # (33) donde Ar es un giro en sentido inverso al del rotor: r A = " cos θ sin θ − sin θ cos θ # (34) Ahora se pueden calcular las nuevas matrices introducidas en (27). En primer lugar, R′ = AT RA = R (35) siempre que sea Rαr = Rβr . En general, por simetrı́a, consideraremos que se cumple esta condición, Rαr = Rβr = Rr , ası́ como la condición Rαe = Rβe = Re . La nueva matriz de inductancias es L′ = Además T = A−1 y Lee 0 Ler 0 0 Lee 0 Ler Ler 0 Lrr 0 0 Ler 0 Lrr dL A= dθ H = A−1 L (36) 0 0 0 −Ler 0 0 Ler 0 er 0 L 0 0 −Ler 0 0 0 dA = dθ 0 0 0 0 0 0 Ler er 0 −L 0 0 0 Lrr 0 −Lrr 0 (37) (38) Y ahora se puede escribir la parte eléctrica en las nuevas coordenadas: v̄ = Re 0 0 0 e 0 R 0 0 0 θ̇Ler Rr θ̇Lrr −θ̇Ler 0 −θ̇Lrr Rr j̄ + 117 Lee 0 Ler 0 0 Lee 0 Ler Ler 0 Lrr 0 0 Ler 0 Lrr dj̄ dt (39) Falta calcular el par: 1 dL 1 Π = īT ī = j̄ T Tj̄ (40) 2 dθ 2 Hemos dicho antes que elegı́amos A de forma que las variables ligadas al estator quedasen inalteradas. Escribimos ahora explı́citamente el nuevo vector de corrientes: j̄ = ieα ieβ ird irq (41) Las intensidades ligadas al nuevo sistema se denominan habitualmente con los subı́ndices ’d’ (de ”directo”) y ’q’ (de ”quadrature”), y al nuevo sistema se le suele llamar (αβdq). Pues bien, en las nuevas variables el par viene dado por Π = Ler (ieβ ird − ieα irq ) (42) y la ecuación para la parte mecánica se escribe entonces: J 5 d2 θ dθ = Ler (ieβ ird − ieα irq ) − β − Πm 2 dt dt (43) Resumen conceptual 1. Se razona a partir del teorema de Gauss que el campo en el que se encuentra el rotor es una función periódica del ángulo, en un instante dado. De ahı́ que se pueda hacer el análisis de la frecuencia fundamental y que el campo B̄ se pueda considerar como la composición de dos campos perpendiculares, B̄α y B̄β , lo que motiva el modelo de máquina generalizada. 2. Se escriben las ecuaciones para la parte eléctrica y se calcula el par a partir de la co-energı́a y en la hipótesis lineal λ̄ = Lī. 3. Al hacer explı́cita una forma de L es posible escribir un conjunto de seis ecuaciones que incluyen la parte eléctrica y la parte mecánica. Se manipulan ligeramente para ponerlas en una forma apta para la resolución numérica y se presenta uno de los muchos algoritmos disponibles para integrar este tipo de sistemas. 118 4. A la vista de la complejidad del sistema anterior, se introduce una transformación de coordenadas que simplica notablemente el sistema, y se re-escribe en las nuevas coordenadas. 6 Ejercicios No se proponen ejercicios para este tema, dada su orientación. Sin embargo, y con vistas al trabajo computacional, se recomienda la implementación del algoritmo de Runge-Kutta. 119 VI La máquina de corriente continua 1 La máquina de corriente continua Al comentar la ecuación V.11, decı́amos que la máquina no puede funcionar si por las bobinas del rotor y del estator circula corriente continua. Pero una máquina puede ser alimentada con corriente continua y, sin embargo, circular corriente no continua internamente. Además, eso es algo que se puede conseguir con facilidad. En la Figura 1 la bobina se encuentra integrada en una pieza circular, discontinua, cuyas partes p y q se ponen en contacto con la fuente de alimentación a través de dos escobillas, A y B. En la posición de la Figura 1, la corriente circula por la bobina de derecha a izquierda. Pero con un pequeño giro adicional la escobilla B pasa a estar en contacto con la parte p y la escobilla A con la parte q, y la corriente en la bobina se invierte. Figura 1 De esta forma, desde una posición inicial, el rotor gira buscando alinearse con el estator. Si cuando se produce este alineamiento se conmuta la corriente en el rotor, cambia la polaridad de su campo y eso fuerza el giro de media vuelta buscando la nueva alineación. Al completarse esta media vuelta vuelve a cambiar la polaridad, y ası́ sucesivamente. En la Figura 1, donde hay una sola bobina, aparece dos escobillas. Si tuviésemos más bobinas, necesitarı́amos, en principio, una pareja de escobillas por cada bobina. Pero hay disposiciones ingeniosas de las bobinas, de forma que sólo se necesita un par de escobillas. Omitiremos aquı́ estos 120 detalles constructivos. Sin embargo, el flujo de la corriente es relevante para la operación de la máquina, y es preciso tenerlo en cuenta. Por ejemplo, si el rotor y el estator se alimentan de forma independiente tenemos una configuración. Si estator y rotor se encuentran en serie alimentados por una misma fuente, tenemos otra. Si se encuentran en paralelo, otra. Incluso puede haber una parte en serie y otra en paralelo. Las Figuras 2a, b, c y d muestran estas posibilidades. Figura 2 2 2.1 Modelo Configuración independiente La máquina de continua conmutada mecánicamente se puede modelar mediante un par de bobinas, una para el estator y otra para el rotor. Si en la máquina generalizada nos quedamos sólo con la bobina β del estator y la bobina ’d’ del rotor, las ecuaciones para la parte eléctrica quedan como 121 " vβe vdr # = " Re + Lee d/dt 0 er r θ̇L R + Lrr d/dt #" jβe jdr # (1) y para la parte mecánica d2 θ dθ = Ler jβe jdr − β − Πm (2) 2 dt dt Estamos asumiendo implı́citamente la configuración independiente de la Figura 2a. Este sigue siendo un sistema no lineal, aunque muy simple. Se puede simplificar todavı́a más si se considera el régimen permanente, en cuyo caso las derivadas respecto al tiempo se anulan. La parte eléctrica se reduce entonces a J vβe = Re jβe vdr = θ̇Ler jβe + Rr jdr (3) donde ahora las tensiones e intensidades son constantes, ası́ como θ̇, la velocidad de giro de la máquina. Para la parte mecánica: Ler jβe jdr = Πm + β θ̇ (4) Si usamos las ecuaciones de la parte eléctrica para obtener las corrientes y sustituimos en la parte mecánica: vβe Re θ̇Ler vβe vdr − = Rr Rr Re ! e vdr θ̇Ler vβe er vβ = L − r e − β θ̇ Re Rr R R jβe = jdr Πm (5) Ası́, Πm es una función lineal de θ̇, de ordenada en el origen vβe vdr L Re Rr er (6) y pendiente Ler vβe −β − Re 122 !2 1 Rr (7) mientras que el par eléctrico es Π= Ler jβe jdr ve = L βe R er vdr θ̇Ler vβe − Rr Rr Re ! (8) que es también una función lineal de θ̇, de ordenada en el origen Ler vβe vdr Re Rr (9) y pendiente 1 − r R Ler vβe Re !2 (10) Se ve que el par se puede modificar de dos formas: o bien modificando vdr , y entonces tenemos una familia de lı́neas caracterı́sticas paralelas, como se muestra en la Figura 3, o bien modificando vβe , en cuyo caso al aumentar vβe aumenta la pendiente, como se muestra en la Figura 4. Aquı́ se ve una diferencia esencial entre el motor de explosión interna y este tipo de motor eléctrico, en el cual el par es una función monótona decreciente de θ̇, mientras que en el primero es creciente hasta alcanzar un máximo y luego decrece. Figura 3 2.2 Configuración en paralelo Cuando el rotor y el estator se alimentan en paralelo con la misma fuente, entonces vβe = vdr = v, y seguimos teniendo una dependencia lineal del par eléctrico con la velocidad angular, con ordenada en el origen 123 Figura 4 Ler v 2 Re Rr (11) y pendiente 1 Ler v 2 (12) − r R Re En la configuración independiente, cuando la fuerza electromotriz inducida iguala a vdr , cesa el par, y esto ocurre para θ̇ = vdr Re Ler vβe (13) En la disposición en paralelo, ocurre para θ̇ = 2.3 Re Ler (14) Configuración en serie La situación es distinta cuando la configuración es en serie, porque en ese caso jβe = jdr = j (15) vβe + vdr = v (16) y Para la parte eléctrica tenemos: 124 vβe = (Re + Lee d )j dt vdr = (θ̇Ler + Rr + Lrr d )j dt (17) Ası́ que v = vβe + vdr = (Re + Rr )j + θ̇Ler j + (Lee + Lrr ) dj dt (18) y para la parte mecánica d2 θ = Ler j 2 − β θ̇ − Πm (19) dt2 En régimen estacionario, las derivadas respecto al tiempo se anulan, y queda J v = (Re + Rr )j + θ̇Ler j 0 = Ler j 2 − β θ̇ − Πm (20) Despejando j de la primera y sustituyendo en la segunda, tenemos para el par: Π = Ler v2 (Re + Rr + θ̇Ler )2 (21) La caracterı́stica de estos motores es que tienen un par de arranque elevado. En efecto, si θ̇ = 0: Π(0) = Ler v 2 (Re + Rr )2 (22) y vemos cómo el par de arranque crece con el cuadrado de la tensión aplicada. Es por eso que esta configuración se usa en motores de tracción. Por ejemplo, se necesita un par muy elevado para poner en marcha a un vehı́culo, o para poner en movimiento un montacargas. Muchos otros aspectos del funcionamiento de la máquina alimentada por corriente continua no serán tratados aquı́, donde nos hemos limitado a extraer las caracterı́sticas básicas del modelo de máquina generalizada que fue propuesto en el capı́tulo anterior. 125 3 Resumen conceptual 1. Se presenta un modelo constructivo sencillo que muestra cómo una máquina puede ser alimentada por corriente continua. Se presentan cuatro configuraciones posibles. 2. Se analiza la máquina de corriente continua particularizando la máquina generalizada al caso en que se consideran sólo jβe y jdr . 3. Para las configuraciones independiente, serie y paralelo, se estudia el régimen estacionario, y en particular las curvas de par. 126 VII La máquina de inducción El principio de la máquina de inducción fue establecido en IV.5. En este capı́tulo vamos a desarrollar con mayor amplitud la teorı́a de este tipo de máquinas. 1 La máquina n-fásica En primer lugar, veamos que la máquina generalizada que presentamos en V se base en que el campo B̄ se puede descomponer en dos campos perpendiculares. Esto no quiere decir que si B̄ es la resultante de un número arbitrario de polos, no podamos considerarlos a cada uno en particular. Si tenemos n bobinas en el estator y otras tantas en el rotor, tenemos un vector de n corrientes īel y un vector de n corrientes īrl , con l = 1, · · · , n. En total, 2n componentes de corriente y 2n componentes de tensión, v̄le y v̄lr . En cuanto a la matriz de resistencias, tendrá la forma " Re 0 0 Rr # (1) donde Re y Rr son matrices diagonales. Falta la matriz de inducciones, de dimensiones 2n × 2n, que se puede considerar subdividida en cuatro submatrices: L= " Le Ler Lre Lr # (2) Le contendrá en su diagonal las autoinducciones de las bobinas del estator, y fuera de la diagonal la inducciones mutuas entre las bobinas del estator, que dependen del coseno del ángulo que forman entre sı́. Como hay n bobinas, se encuentran separadas por un ángulo 2π/n, de manera que la inducción mutua entre la bobina i y la bobina j será de la forma Le (i, j) = M e cos(2π(i − j)/n) (3) Lr (i, j) = M r cos(2π(i − j)/n) (4) Por el mismo razonamiento, Lr contendrá en su diagonal las autoinducciones de las bobinas del rotor, y fuera de la diagonal Faltan las submatrices Ler y Lre . Supondremos que Ler (i, j) = Lre (j, i), por simetrı́a. Si θ es el ángulo del rotor respecto al estator: 127 Ler (i, j) = M er cos(θ + 2π(i − j)/n) (5) Siguen siendo válidas las ecuaciones V.13, en las cuales el par eléctrico se obtiene de V.7. Como se ve, no hay nada nuevo, y una rutina de integración numérica que resuelva el problema puede parametrizarse en función del número de fases n. 2 La máquina trifásica Por su relevancia en la industria, vamos a tratar con una máquina trifásica, que es una particularización de lo dicho hasta ahora, con n = 3. Otra particularidad es que las tensiones no son cualesquiera, sino tensiones alternas desfasadas entre sı́. La idea es que si excitamos los polos del estator con un cierto desfase entre sı́, es como si tuviésemos un sólo polo giratorio que en su movimiento arrastra al rotor tras de sı́. En el caso más simple posible, tendrı́amos una bobina de rotor y una bobina de estator, excitada con una frecuencia angular igual a la de rotación del rotor, de forma que en el recorrido ABC en la Figura 1 las bobinas se repelen, y en el recorrida CDA se atraen. Es evidente que podemos seguir añadiendo bobinas, pero también que es preciso encontrar un equilibrio entre las caracterı́sticas electro-mecánicas y la complejidad constructiva y robustez de la máquina. Parece que, para la industria de las máquinas eléctricas, este equilibrio se encuentra en n = 3. Figura 1 En lo que sigue, usaremos un modelo como el de la Figura 2, donde el estator y el rotor están compuestos por tres bobinados de dos polos, en 128 disposición simétrica. Nos referiremos con los subı́ndices (a, b, c) a cada bobinado y con los superı́ndices (e, r) al estator y al rotor. Supondremos que el campo es radial en el ”gap”. Supondremos relaciones lineales entre el flujo y las intensidades, escribiendo λ̄ = Lī y partiremos de las ecuaciones básicas V.13. Figura 2 Como la resistencia de cada bobina depende sólo de la intensidad que atraviesa esa bobina, la matriz de resistencias será diagonal: R= " Re 0 0 Rr # = Re 0 0 0 0 0 0 Re 0 0 0 0 0 0 Re 0 0 0 0 0 0 Rr 0 0 0 0 0 0 Rr 0 0 0 0 0 0 Rr En cuanto a la matriz de inductancias: L= " Le Le r Lre Lr # (6) (7) Le da cuenta de las inducciones mutuas y autoinducciones en las bobinas del estator: Leaa Leab Leac e e L = Lba Lebb Lebc Leca Lecb Lecc 129 (8) Si suponemos que las autoinducciones son iguales entre las tres bobinas, Leaa = Lebb = Lecc = Le . En cuanto a las inducciones mutuas, llamaremos M e al valor máximo de la inducción mutua entre las bobinas del estator, que ocurrirá cuando el flujo que atraviesa a una de ellas producido por otra es máximo, y dependerá de la orientación relativa de ambas, como se discutió en V.2.1. Entonces Le − 12 M e − 12 M e Le M e cos 2π/3 M e cos 2π/3 Le M e cos 2π/3 = − 12 M e Le − 12 M e Le = M e cos 2π/3 M e cos 2π/3 M e cos 2π/3 Le − 12 M e − 21 M e Le (9) y por el mismo razonamiento Lr − 21 M r − 12 M r r 1 r Lr − 12 M r L = −2M Lr − 21 M r − 12 M r (10) Pasamos a Ler y Lre . Por simetrı́a, estas matrices han de ser la una traspuesta de la otra. Si θ es el ángulo que forman el estator y el rotor: M er cos θ M er cos(θ − 4π/3) M er cos(θ − 2π/3) er M er cos θ M er cos(θ − 4π/3) Ler = M er cos(θ − 2π/3) = M R(θ) er er er M cos(θ − 4π/3) M cos(θ − 2π/3) M cos θ (11) con cos θ cos(θ − 4π/3) cos(θ − 2π/3) cos θ cos(θ − 4π/3) R(θ) = cos(θ − 2π/3) cos(θ − 4π/3) cos(θ − 2π/3) cos θ (12) Las ecuaciones para la parte eléctrica son entonces: ū = " Re 0 0 Rr # d ī + dt " Le M er R(θ) er T M R (θ) Lr # ! ī (13) y el par, como sabemos, viene dado por 1 dL ī (14) Π = īT 2 dθ Como sólo las submatrices superior derecha e inferior izquierda de L dependen de θ, se produce el siguiente desacoplo: 130 1 Π = [(īe )T , (īr )T ] 2 M er dR/dθ 0 er T M dR /dθ 0 Es decir 1 dR r dRT e Π = M er (īe )T ī + (īr )T ī 2 dθ dθ " " īe īr # (15) # (16) dRT e dR r ī = M er (īr )T ī dθ dθ (17) y es fácil comprobar que Π = M er (īe )T con sin θ sin(θ − 4π/3) sin(θ − 2π/3) dR sin θ sin(θ − 4π/3) = − sin(θ − 2π/3) dθ sin(θ − 4π/3) sin(θ − 2π/3) sin θ 2.1 (18) Transformación de Park En IV.5 discutimos los motores monofásicos y vimos que habı́a dos casos prácticos importantes, el de los motores sı́ncronos y el de los ası́ncronos. En los primeros, la frecuencia angular mecánica coincide con la eléctrica, y en los segundos no. Esto motiva la búsqueda de una transformación genérica a unos ejes rotatorios (d, q), cuya frecuencia angular después se pueda particularizar para diversos casos. En la Figura 3 se representan tres ejes eléctricos desfasados en 2π/3, que llamaremos (a, b, c), y dos ejes rotatorios (d, q). Proyectando cada uno de los ejes eléctricos sobre d y sobre q, vemos que la relación entre las coordenadas de un vector x̄ en (a, b, c) y las coordenadas en (d, q) es la siguiente: x̄dq = " cos θ cos(θ − 2π/3) cos(θ − 4π/3) − sin θ − sin(θ − 2π/3) − sin(θ − 4π/3) # x̄abc (19) Si vamos a V.4, donde presentamos la teorı́a general de las transformaciones de coordenadas, vemos que allı́ se precisa la matriz inversa de la matriz de transformación, cosa que es imposible en nuestro razonamiento actual porque tenemos una matriz que no es cuadrada. Para solucionar este problema formal, introducimos una tercera componente en el sistema (d, q), que, de acuerdo con la costumbre, llamaremos ’0’. Ası́, en el sistema (d, q, 0), la transformación que deseamos es 131 Figura 3 x̄dq0 cos θ cos(θ − 2π/3) cos(θ − 4π/3) = − sin θ − sin(θ − 2π/3) − sin(θ − 4π/3) x̄abc ? ? ? (20) La idea es que la transformación, representada por la matriz A, ha de ser tal que la potencia suministrada a la máquina sea la misma en un sistema y en otro, es decir P = īTdq0 v̄dq0 = (Aīabc )T (Av̄abc ) = īTabc AT Av̄abc (21) y eso implica que ha de ser AT A = I. Como la matriz I se caracteriza por dos condiciones: a) que los elementos de la diagonal sea iguales a 1 y b) que los elementos de fuera de la diagonal sean nulos, vamos a intentar como matriz de transformación una que dependa de dos parámetros, k1 y k2 , y después ajustaremos esos parámetros para tratar de que se cumplan a) y b). Ası́ pues, intentamos con cos θ cos(θ − 2π/3) cos(θ − 4π/3) − sin θ − sin(θ − 2π/3) − sin(θ − 4π/3) A = k1 k2 k2 k2 (22) de donde k22 + 1 k22 − 1/2 k22 − 1/2 k22 + 1 k22 − 1/2 AT A = k12 k22 − 1/2 2 2 2 k2 − 1/2 k2 − 1/2 k2 + 1 132 (23) q √ y como esta matriz debe ser igual a la identidad, k2 = 1/ 2 y k1 = 2/3. En definitiva: A= q cos θ cos(θ − 2π/3) cos(θ − 4π/3) − 2π/3) − sin(θ √ − 4π/3) 2/3 − sin √ θ − sin(θ √ 1/ 2 1/ 2 1/ 2 (24) Las intensidades, flujos y voltajes en ambos sistemas se relacionan entre sı́ a través de esta matriz. A esta transformación se la conoce como ”transformación de Park” (Park, 1929). En lo sucesivo, y como esta transformación tiene nombre propio, a su matriz la llamaremos P en lugar de A. 2.2 Utilidad de la transformación de Park Si volvemos a (13), aquéllas son, obviamente, las ecuaciones en el sistema (a, b, c), aunque no las distinguiésemos ası́ explı́citamente. Ahora necesitamos hacerlo. A las cantidades en el sistema (a, b, c) las distinguiremos con el subı́ndice ’a’, y a las cantidades en el sistema (d, q, 0) con el subı́ndice ’0’. d λ̄a = ūa − Ra īa dt (25) Figura 4 Para pasar al sistema (d, q, 0), tengamos en cuenta que para el rotor la transformación es P(θr ), y para el estator, P(θe ). Además, en la Figura 4 se ve que, si θ es el ángulo relativo entre estator y rotor, θ = θe − θr . Ası́ que 133 desdoblamos la ecuación anterior en dos: una para el estator y otra para el rotor: d e λ̄ = ūea − Rea īea dt a d r λ̄ = ūra − Rra īra dt a (26) y escribiendo las cantidades (a, b, c) en función de las cantidades (d, q, 0): d −1 (P (θe )λ̄e0 ) = P−1 (θe )ūe0 − Rea P−1 (θe )īe0 dt d −1 (P (θr )λ̄r0 ) = P−1 (θr )ūr0 − Rra P−1 (θr )īr0 dt (27) Efectuando las derivadas de la izquierda y premultiplicando por P: dP−1 (θe ) dλ̄e0 + P(θe ) = ūe0 − Rea īe0 dt dt dλ̄r0 dP−1 (θr ) + P(θr ) = ūr0 − Rra īr0 dt dt (28) Ahora, se comprueba sin dificultad que 0 −1 0 dP (θ) P(θ) = θ̇ 1 0 0 dt 0 0 0 −1 (29) con lo cual, podemos escribir explı́citamente las componentes de (28): dλed /dt − θ̇e λeq = ued − Re ied dλeq /dt + θ̇e λed = ueq − Re ieq dλe0 /dt = ue0 − Re ie0 dλrd /dt − θ̇r λrq = urd − Rr ird dλrq /dt + θ̇r λrd = urq − Rr irq dλr0 /dt = ur0 − Rr ir0 Consideremos ahora los flujos: 134 (30) λ̄ea = Le īea + Ler īra λ̄ra = (Ler )T īea + Lr īra (31) P−1 (θe )λ̄e0 = Le P−1 (θe )īe0 + M er R(θ)P−1 (θr )īr0 P−1 (θr )λ̄r0 = M er RT (θ)P−1 (θe )īe0 + Lr P−1 (θr )īr0 (32) al pasar a (d, q, 0): Premultiplicando la primera por P(θe ) y la segunda por P(θr ), tenemos: " λ̄e0 λ̄r0 # = " P(θ)Le P−1 (θe ) M er P(θe )R(θ)P−1 (θr ) er T −1 M P(θr )R (θ)P (θe ) P(θr )Lr P−1 (θr ) #" īe0 īr0 # (33) Y ahora pasamos a calcular las submatrices. En primer lugar 0 0 Le + 21 M e e −1 1 e e 0 L + 2M 0 P(θe )L P (θe ) = e e 0 0 L −M (34) Lr + 12 M r 0 0 r −1 1 r r 0 L + 2M 0 P(θr )L P (θr ) = 0 0 Lr − M r (35) y análogamente: En cuanto a las otras dos submatrices, veamos que 1 0 0 3 M er P(θe )R(θ)P−1 (θr ) = M er 0 1 0 2 0 0 0 (36) simplificación que se alcanza teniendo en cuenta que θ = θe − θr . Como ésta es una matriz diagonal, coincide con su traspuesta, pero vemos que [P(θe )R(θ)PT (θr )]T = P(θr )RT (θ)PT (θe ) (37) y si tenemos en cuenta que PT = P−1 : 1 0 0 3 er er T −1 M P(θr )R (θ)P (θe ) = M 0 1 0 2 0 0 0 135 (38) Por fin es posible apreciar qué extraordinaria simplificación produce la transformación de Park. En primer lugar, los coeficientes de la matriz de inducciones son constantes. En segundo lugar, las intensidades están desacopladas. 2.3 Par El par se calcula a partir de (17). Aplicando la transformación de Park: Π = M er (īea )T dR r dR T P (θr )īr0 īa = M er (īe0 )T P(θe ) dθ dθ (39) pero 0 −1 0 dR T 3 P(θe ) P (θr ) = 1 0 0 dθ 2 0 0 0 (40) ası́ que, finalmente 3 Π = M er (ieq ird − ied irq ) 2 2.4 (41) Casos particulares Como el sistema (d, q, 0) es arbitrario, hemos obtenido unas ecuaciones generales que ahora es posible particularizar. Teniendo en cuenta que θ = θr − θe , tenemos tres casos de interés: a) Cuando el sistema (d, q, 0) se hace coincidir con el estator, es θe = 0 y por tanto θr = θ, y las ecuaciones (30), teniendo en cuenta (34), (35), (36) y (37), se pueden escribir como ū = Re + pl1 0 0 pm 0 0 e 0 R + pl1 0 0 pm 0 e 0 0 R + pl2 0 0 0 pm −θ̇m 0 Rr + pl3 −θ̇l3 0 r θ̇m pm 0 θ̇l3 R + pl3 0 r 0 0 0 0 0 R + pl4 donde 136 ī (42) ū = ued ueq ue0 urd urq ur0 ; ī = ied ieq ie0 ird irq ir0 (43) p es el operador derivada temporal (p = d/dt) y l1 = Le + 12 M e , l2 = Le − M e , l3 = Lr + 21 M r , l4 = Lr − M r , m = 23 M er . b) Cuando el sistema se hace coincidir con el rotor, es θr = 0 y por tanto θe = −θ. Se tiene: ū = Re + pl1 θ̇l1 0 pm θ̇m 0 e −θ̇l1 R + pl1 0 −θ̇m pm 0 e 0 0 R + pl2 0 0 0 pm 0 0 Rr + pl3 0 0 r 0 pm 0 0 R + pl3 0 0 0 0 0 0 Rr + pl4 ī (44) c) Cuando el sistema (d, q, 0) se hace girar con la velocidad sincrónica, θe = θr ū = 3 Re + pl1 −θ̇e l1 0 pm −θ̇e m 0 e θ̇e l1 R + pl1 0 θ̇e m pm 0 0 0 Re + pl2 0 0 0 pm −θ̇e m 0 Rr + pl3 −θ̇e l3 0 r θ̇e m pm 0 θ̇e l3 R + pl3 0 0 0 0 0 0 Rr + pl4 ī (45) Bibliografı́a Parte del material contenido en este capı́tulo proviene del capı́tulo 2, ”Dynamic modeling of Induction machines”, de ”Vector control of induction machines”, B. Robyns et al. Puede consultarse también ”Matrix analysis of electric machinery”, de N. N. Hancock. Gran parte de la bibliografı́a disponible basa la discusión en el formalismo de fasores en el plano complejo, que hemos omitido aquı́ completamente. Otras referencias que pueden 137 ser útiles: ”d, q reference frames for the simulation of induction motors”, de R.J. Lee, P. Pillay y R.G. Harley; En ”High performance drives”, de E. Levi, el capı́tulo ”Mathematical modelling of an induction machine and the supply”. Rara vez se considera la parte mecánica, por eso puede ser interesante ”Analysis and modelling of an induction machine with a pulsating load torque used for a washing machine application”, de Magnus Hedin y Linda Lundström. Para una ilustración del uso de los distintos sistemas de referencia, con simulaciones numéricas, véase ”Transient analysis of three-phase induction machine using different reference frames”, de Vivek Pahwa y K. S. Sandhu. 4 Resumen conceptual 1. Se razona sobre una máquina hipotética de un número arbitrario de fases, y se ve cual serı́a la forma de la matriz L. Al considerar una máquina de tres fases, se escriben las matrices R y L. 2. A partir de las formas especı́ficas para las matrices, se obtienen las ecuaciones de la parte eléctrica y el par. 3. Al poner en relación las variables en el sistema (a, b, c) con las variables (d, q) que usamos en la máquina generalizada, vemos que la matriz de transformación es de 2 × 3, lo que es un inconveniente formal ya que al poner en relación a ambos sistemas necesitamos la matriz inversa de la transformación, que en este caso no existe. Por eso, se amplia el sistema (d, q) introduciendo un eje adicional (d, q, 0) y se especula sobre cómo la matriz de transformación original deberı́a ampliarse. 4. Se obtiene finalmente la relación entre los sistemas (a, b, c) y (d, q, 0). Se trata de la transformación de Park. 5. Se usa la transformación de Park para encontrar las ecuaciones generales de la máquina en el sistema (d, q, 0), y se muestra la gran simplificación conseguida, que puede ser aún más si se consideran, lo que se hace en la última sección, velocidades angulares particulares. 5 Ejercicios Dado el carácter algebraico de este capı́tulo, recomendamos al estudiante que se ayude de un programa de cálculo simbólico para verificar algunas de las relaciones que hemos usado. Los ejercicios propuestos van en este sentido. 138 1. Verificar la ecuación (29). 2. Verificar (34). 3. Verificar (36). 4. Verificar (40). 139