ANÁLISIS NO-REGULAR Y TEOREMAS DE INVERSIÓN GLOBAL Óscar Reynaldo Madiedo Castro Universidad Complutense de Madrid Facultad de Ciencias Matemáticas Departamento de Análisis Matemático Madrid 2010 ANÁLISIS NO-REGULAR Y TEOREMAS DE INVERSIÓN GLOBAL MSC 49J55, 46G05 Óscar Reynaldo Madiedo Castro Trabajo de Máster presentado como requisito parcial para optar al tı́tulo de Máster en Investigación Matemática Director JESÚS ÁNGEL JARAMILLO Universidad Complutense de Madrid Facultad de Ciencias Matemáticas Departamento de Análisis Matemático Máster en Investigación Matemática Madrid 2010 El abajo firmante, matriculado en el Máster en Investigación Matemática de la Facultad de Ciencias Matemáticas, autoriza a la Universidad Complutense de Madrid (UCM) a difundir y utilizar con fines académicos, no comerciales y mencionando expresamente a su autor el presente Trabajo Fin de Máster: “Análisis no-regular y Teoremas de Inversión Global”, realizado durante el curso académico 2009-2010 bajo la dirección del Profesor Jesús Angel Jaramillo en el Departamento de Análisis Matemático, y a la Biblioteca de la UCM a depositarlo en el Archivo Institucional EPrints Complutense con el objeto de incrementar la difusión, uso e impacto del trabajo en internet y garantizar su preservación y acceso a largo plazo. Fdo. Óscar Reynaldo Madiedo Castro Este trabajo está dedicado a mi hija Laura Camila. Agradecimientos Agradezco en primer lugar a mis padres Reynaldo Madiedo y Martha Castro, por estar siempre ahı́ apoyándome en todo proceso de mi vida y por tener fe en mı́. A mi director de trabajo de fin de master Jesús Ángel Jaramillo Aguado, por todo el acompañamiento que me dio en el transcurso del máster, además fue quien aceptó la no muy grata tarea de corregir mis innumerables errores, convirtiendo la lectura de este texto más agradable. Y en especial a mi hija Laura Camila y a mi compañera Norah Alexandra Torres, quienes me han dado todo su apoyo y comprensión para poder realizar este sueño de ser Doctor. TITLE: NONSMOOTH ANALYSIS AND GLOBAL INVERTIBILITY THEOREMS* AUTHOR: Óscar Reynaldo Madiedo Castro** KEY WORDS: Generalized Gradients, Jacobian Generalized, Differentiability, Subdifferential, Diffeomorphically locally, Global Invertibility, Lipschitz Function, Nonsmooth Analysis, Homeomorphically. DESCRIPTION The classical theorem of Hadamard global invertibility provides conditions for a local diffeomorphism f : Rn → Rn to be locally invertible, in terms of growth of the inverse of the differential of the function f . This result has been stated in many different contexts, which have led to interesting applications (see [9] which presents a brief history of the issue and provides further contributions). The aim of this work is to study analogous results of global invertibility in the context of nonsmooth analysis. In particular, we will study the work of Pourciau [20, 21], where global invertibility conditions are obtained for a locally bi-Lipschitz homeomorphism in terms of the generalized gradient of Clarke (see [3] for a recent treatment of this concept). * ** Initial work for research FACULTY OF MATHEMATICAL SCIENCES, LICENCIATURA EN MATEMÁTICAS. DIRECTOR JESÚS ÁNGEL JARAMILLO. TITULO: AUTOR: ANÁLISIS NO-REGULAR Y TEOREMAS DE INVERSIÓN GLOBAL* Óscar Reynaldo Madiedo Castro** PALABRAS CLAVES: Gradiente Generalizado, Jacobiano Generalizado, Diferenciabilidad, Subdiferencial, inversión Local, Inversión global, Función Lipschitz, Análisis no-regular, Homeomorfismos. DESCRIPCIÓN El teorema clásico de inversión global de Hadamard proporciona condiciones para que un difeomorfismo local f : Rn → Rn sea globalmente invertible, en términos del crecimiento de la inversa de la diferencial de la función f . Este resultado ha sido objeto de un gran número de modificaciones y variantes en distintos contextos, que han dado lugar a interesantes aplicaciones (véase a este respecto [9], donde se presenta un breve resumen histórico del tema y se obtienen nuevas aportaciones). El presente Trabajo se propone estudiar resultados análogos de inversión global en el contexto del análisis no-regular. Se estudiarán en particular los artı́culos de Pourciau [20, 21], donde se obtienen condiciones de inversión global para un homeomorfismo localmente bi-Lipschitz f : Rn → Rn en términos del gradiente generalizado de Clarke (véase [3] para un tratamiento reciente sobre este concepto). * ** Trabajo de Iniciación a la Investigación FACULTAD DE CIENCIAS MATEMÁTICAS, DEPARTAMENTO DE ANÁLISIS MATEMÁTICO. DIRECTOR JESÚS ÁNGEL JARAMILLO. Contenido INTRODUCCIÓN II 1. GRADIENTE GENERALIZADO EN ESPACIOS DE BANACH 1 1.1. DEFINICIONES Y PROPIEDADES BÁSICAS . . . . . . . . . . . . . . . . 1 1.2. CÁLCULOS BÁSICOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.3. RELACIÓN CON LAS DERIVADAS . . . . . . . . . . . . . . . . . . . . . . 12 1.4. FUNCIONES CONVEXAS . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2. JACOBIANO GENERALIZADO Y TEOREMA DE LA FUNCIÓN INVERSA 20 2.1. JACOBIANO GENERALIZADO . . . . . . . . . . . . . . . . . . . . . . . . 20 2.2. TEOREMA DE LA FUNCIÓN INVERSA . . . . . . . . . . . . . . . . . . . 26 3. INVERSIÓN GLOBAL DE FUNCIONES NO-REGULARES 33 3.1. RESULTADOS PREVIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 3.2. INVERSIÓN LOCAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.3. LEMAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.4. INVERSIÓN GLOBAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 CONTENIDO Bibliografı́a i 43 INTRODUCCIÓN Fenómenos No-regulares en Matemáticas y Optimización se producen de forma natural y con frecuencia; en optimización un problema se resuelve maximizando o minimizando la función, en tal caso su derivada se anula, pero para el caso No-regular tratamos con funciones que no necesariamente son diferenciables. Por esto se ve la necesidad de estudiar propiedades de diferenciabilidad de funciones no diferenciables a partir del Gradiente Generalizado propuesto por Clarke (ver [4]). En el Capı́tulo 1 se dan las nociones básicas sobre el Gradiente Generalizado de Clarke y se muestran sus propiedades básicas. En el capitulo 2 se define el Jacobiano Generalizado de Clarke y se muestra el teorema de la función inversa para funciones que no necesariamente son diferenciables (ver [6]). Por ultimo en el Capı́tulo 3, de acuerdo con el Teorema de Hadamard que establece un criterio de inversion global para funciones C 1 , Pourciau (ver [23]) lo extiende a funciones localmente Lipschitz utilizando el Jacobiano Generalizado de Clarke. ii Capı́tulo 1 GRADIENTE GENERALIZADO EN ESPACIOS DE BANACH La terminologı́a y notación de está sección es tomada de Clarke [4]. En este capı́tulo se reúnen un conjunto de herramientas básicas que se utilizarán en el transcurso de todo el trabajo. La teorı́a y el cálculo del gradiente generalizado se desarrollan en detalle, comenzando con el caso general de funciones con valores reales localmente Lipschitz definidas en un espacio de Banach y terminando con el caso de espacios de dimensión finita. 1.1. DEFINICIONES Y PROPIEDADES BÁSICAS Se va a trabajar en un espacio de Banach X, y cada elemento x ∈ X va hacer referencia a un punto como vector, denotaremos por kxk, BX y BX la norma, bola de unidad abierta y bola de unidad cerrada respectivamente. LA CONDICIÓN DE LIPSCHITZ Sea Y un subconjunto de X. Diremos que una función f : Y → R satisface la condición de Lipschitz (en Y ), siempre que, para algún K no-negativo, y para todo par de puntos y, y 0 ∈ Y satisface: |f (y) − f (y 0 )| ≤ Kky − y 0 k 1 (1.1) Gradiente Generalizado en Espacios de Banach esto también es equivalente a la condición de Lipschitz de constante K. Diremos que f es Lipschitz (de constante K) cerca de x si, para algún ε > 0, f satisface la condición de Lipschitz (de constante K) en el conjunto x + εBX (es decir, dentro de una ε - vecindad de x). DERIVADA DIRECCIONAL GENERALIZADA Definición 1.1. Sean X un espacio de Banach, f : X −→ R una función Lipschitz cerca de un punto x dado, y v un vector en X. La Derivada Direccional Generalizada de f en x en la dirección v, denotada por f ◦ (x; v) se define: f ◦ (x; v) = lı́m sup y→x t↓0 f (y + tv) − f (y) , t donde y es un vector en X y t es un escalar positivo. En la definición nos podemos dar cuenta que no se supone la existencia del lı́mite (solo del lı́mite superior). Esto implica solo el comportamiento de f arbitrariamente muy proximo a x, y se diferencia de las definiciones tradicionales de derivada direccional en que el punto base y del cociente de la diferencia varı́a. De la utilidad de f ◦ se desprenden las siguientes propiedades básicas. Una función g es Positivamente Homogénea si g(λv) = λg(v) para λ ≥ 0, y Subaditiva si g(v+w) ≥ g(v)+g(w). Proposición 1.1. Sea f una función Lipschitz de constante K cerca de x. Entonces: (a) La función f ◦ (x; ·) : X → R donde a cada v 7→ f ◦ (x; v) es finita, positivamente homogénea y subaditiva en X, y satisface |f ◦ (x; v)| ≤ Kkvk (b) f ◦ (x; v) es semicontinua superiormente en función de (x; v) y, como una función de solo de v, es Lipschitz de constante K en X. (c) f ◦ (x; −v) = (−f )◦ (x; v) Demostración. En vista de la condición de Lipschitz, el valor absoluto de la diferencia en el cociente de la 2 Gradiente Generalizado en Espacios de Banach definición de f ◦ (x; v) esta acotado por Kkvk cuando y esta suficientemente cerca de x y t suficientemente cerca a 0. De esto se deduce que |f ◦ (x; v)| admite la misma cota superior. El hecho de que f ◦ (x; v) = λf ◦ (x, v) para cualquier λ > 0 es inmediato, ası́ que ahora miraremos la subaditividad f ◦ (x; v + w) = lı́m sup y→x t↓0 f (y + t(v + w)) − f (y) t f (y + tv + tw) − f (y) t f (y + tv + tw) − f (y − tw) + f (y + tw) − f (y) lı́m sup t f (y + tw) − f (y) f (y + tv + tw) − f (y + tw) + lı́m sup lı́m sup t t f (y + tw + tv) − f (y + tw) f (y + tw) − f (y) lı́m sup + lı́m sup t t ◦ ◦ f (x; v) + f (x; w) = lı́m sup = ≤ ≤ ≤ (Donde el lı́mite superior de una suma esta acotado superiormente por la suma de los lı́mites superiores). El primer lı́mite es la expresión f ◦ (x; v) donde el primer término y + tw → x cuando y → x y t ↓ 0. Por lo tanto f ◦ (x; v + w) ≤ f ◦ (x; v) + f ◦ (x; w) que es lo que se requiere en (a). Ahora sean {xi } y {vi } sucesiones arbitrarias que convergen a x y v respectivamente. Para cada i ∈ N, por definición de limite superior, existen yi en X y ti tales que 1 , i 1 f (yi + ti vi ) − f (yi ) ≤ f ◦ (xi ; vi ) − i ti f (yi + ti v) − f (yi ) f (yi + ti vi ) − f (yi + ti v) = + ti ti kyi − xi k + ti < Nótese que este último término esta acotado en valor absoluto por Kkvi − vk (en vista de la condición de Lipschitz). Tomando lı́mites superiores cuando i → ∞ tenemos que lı́m sup f ◦ (xi ; vi ) ≤ f ◦ (x; v) i→∞ Por lo tanto, se establece la semicontinuidad superior. Finalmente, dados cualesquiera v y w en X, tenemos f (y + tv) − f (y) ≤ f (y + tw) − f (y) + Kkv − wkt 3 Gradiente Generalizado en Espacios de Banach 4 para y cercano a x, y t > 0. Dividiendo por t y usando lı́mites superiores cuando y → x, t ↓ 0 tenemos, f ◦ (x; v) ≤ f ◦ (x; w) + Kkv − wk Dado que v y w son arbitrarios se obtiene (b). Para probar (c), calculamos f ◦ (x; −v) := lı́m sup x0 →x t↓0 = lı́m sup u→x t↓0 f (x0 − tv) − f (x0 ) t (−f )(u + tv) − (−f )(u) , donde u := x0 − tv t = (−f )◦ (x; v) Definición 1.2. Dado un subconjunto no-vacı́o Σ de X ∗ , su función soporte HΣ : X → (−∞, ∞] definida de manera única ası́: es la función HΣ (v) := sup{hζ, vi : ζ ∈ Σ}, donde X ∗ es el espacio dual de funcionales lineales y continuos en X. A continuación se muestra algunas propiedades importantes sobre la función soporte. Proposición 1.2. (a) Sea Σ un subconjunto no-vacı́o de X ∗ . Entonces HΣ es positivamente homogénea, subaditiva y semicontinua superiormente. (b) Si Σ es convexo y w∗ - cerrado, entonces un punto ζ en X ∗ pertenece a Σ si, y solamente si, se tiene HΣ (v) ≥ hζ, vi, para todo v ∈ X. (c) De manera mas general, si Σ y Λ son dos conjuntos no-vacı́os, convexos, y w∗ - cerrados de X ∗ , entonces, Σ ⊃ Λ si y solamente si, HΣ (v) ≥ HΛ , para todo v ∈ X. (d) Si p : X → R es positivamente homogénea, subaditiva y acotada en la bola de unidad, entonces hay un único subconjunto Σ de X ∗ que es no-vacı́o, convexo y w∗ - compacto tal que p = HΣ . Gradiente Generalizado en Espacios de Banach 5 Demostración. El hecho que HΣ sea positivamente homogénea y subaditiva se sigue de su definición, ahora HΣ es semicontinua superiormente por ser el supremo de funciones continuas, por lo tanto obtenemos (a). Para obtener (c), resulta inmediato de acuerdo con (b); ahora probaremos (d). Dado p, definimos el conjunto Σ := {ζ ∈ X ∗ : p(v) ≥ hζ, vi, para todo v ∈ X} . Entonces Σ es convexo como consecuencia de p, y w∗ - cerrado como la intersección de una familia de subconjuntos w∗ - cerrados. Si K es una cota para p en la BX (0; 1), entonces tenemos hζ, vi ≤ K, para todo v ∈ BX (0; 1) y para cualquier elemento de ζ de Σ. De acuerdo con el teorema de separación de Hahn-Banach (ver Rudin (1973, Teorema 3.4)) se sigue que Σ es acotado y además w∗ - compacto. Ahora para mirar que p = HΣ , es claro que p ≥ HΣ , por lo tanto pasaremos a probar la igualdad. Sea v ∈ X dado. Entonces por la forma estándar del teorema de Hahn-Banach (ver Rudin (1973, Teorema 3.2)), existe ζ ∈ X ∗ tal que hζ, wi ≤ p(w), para todo w ∈ X, y con hζ, vi = p(v). Por lo tanto ζ ∈ X ∗ de modo que HΣ (v) = p(v). Por último la unicidad de Σ se obtiene de (c). Ahora retornemos a nuestra función f , y tomando a la función p de la proposición anterior como f ◦ (x; ·), definimos el Gradiente Generalizado de f en x, denotado por ∂f (x), como el subconjunto (no-vacı́o) w∗ - compacto de X ∗ , cuya función soporte es f ◦ (x; ·). Ası́ ζ ∈ ∂f (x) si y solamente si, f ◦ (x; v) ≥ hζ, vi, para todo v ∈ X GRADIENTE GENERALIZADO Definición 1.3. Sea f una función Lipschitz. El Gradiente Generalizado de Clarke de f en x, denotado por ∂f (x), es el subconjunto de X ∗ dado por ∂f (x) := {ζ ∈ X : f ◦ (x; v) ≥ hζ, vi, para todo v ∈ X} Denotamos por kζk la norma natural en X ∗ definida: kζk := sup{hζ, vi : v ∈ X, kvk ≤ 1} Gradiente Generalizado en Espacios de Banach 6 y B∗X denota la bola abierta de unidad en X ∗ . A continuación se resumen algunas propiedades básicas del Gradiente Generalizado. Proposición 1.3. Sea f una función Lipschitz de rango K cerca de x. Entonces: (a) ∂f (x) es un subconjunto de X ∗ , no-vacı́o, convexo y w∗ - compacto y kζk ≤ K, para todo ζ ∈ ∂f (x). (b) Para todo v ∈ X, se tiene f ◦ (x, v) = máx{hζ, vi : ζ ∈ ∂f (x)}. (c) ζ ∈ ∂f (x) si y solamente si, f ◦ (x; v) ≥ hζ, vi, para todo v ∈ X. Demostración. Ya hemos señalado que ∂f (x) es no-vacı́o y w∗ - compacto. Ahora cada ζ ∈ ∂f (x) satisface hζ, vi ≤ f ◦ (x; v) ≤ Kkvk, para todo v ∈ X, donde kζk ≤ K con lo cual se obtiene (a). Las afirmaciones (b) y (c) simplemente reiteran que f ◦ (x; ·) es la función soporte de ∂f (x). Ejemplo 1.1. Calcular el Gradiente Generalizado de Clarke para el caso de X = R y f (x) = |x|. Como f es Lipschitz procedemos a calcular ∂f (x), para esto analizaremos tres casos. Para el caso x > 0, calculamos y + tv − y = v, f ◦ (x; v) = y→x lı́m t t↓0 de modo que ∂f (x), es el conjunto de números ζ que satisfacen v ≥ ζv para todo v, de esta manera ∂f (x) se reduce a {1}. El siguiente caso, si x < 0, similarmente a lo anterior se deduce que ∂f (x) = {−1}. Y por último si x = 0 encontramos ( v si v ≤ 0 f ◦ (0; v) = −v si v < 0; luego, f ◦ (0; v) = |v|. Ası́ ∂f (0) consiste en aquellos ζ que satisfacen |v| ≥ ζv para todo v, por lo tanto, ∂f (0) = [−1, 1]. Gradiente Generalizado en Espacios de Banach 7 Definición 1.4. Una función multivaluada f se dice que es semicontinua superiormente en x si para todo ε > 0 existe δ > 0 tal que kx − yk < δ =⇒ f (y) ⊂ f (x) + εBX Proposición 1.4. Sean {xi } y {ζi } sucesiones en X y X ∗ respectivamente, tales que ζi ∈ ∂f (xi ) para cada i ∈ N, y si xi → x y ζ es un w∗ - punto de acumulación de la sucesión {ζi }, entonces ζ ∈ ∂f (x) Demostración. Fijamos v ∈ X, para cada i, tenemos f ◦ (xi ; v) ≥ hζi , vi, ahora la sucesión {hζi , vi} esta acotada en R y contiene términos arbitrariamente cerca de hζ, vi. Si extraemos una subsucesión {ζi } tal que hζi , vi → hζ, vi, ahora tomando lı́mites en la desigualdad anterior tenemos que f ◦ (x; v) ≥ hζ, vi, por lo tanto f ◦ es semicontinua superiormente en x (Proposición 1.1) Proposición 1.5. Si X es finito dimensional, entonces ∂f es semicontinua superiormente en x. Demostración. Dado un ε > 0, lo que queremos mostrar es que para todo y lo suficientemente cercano a x, tenemos ∂f (y) ⊂ ∂f (x) + εB X si este no es el caso, entonces existe una sucesión yi que converge a x y puntos ζi ∈ ∂f (yi ) tales que ζi 6∈ ∂f (x)+εB X . Por lo tanto podemos separar ζi del conjunto convexo y compacto en cuestión; para algunos vi 6= 0 tenemos: hζi , vi i ≥ máx{hζ, vi i : ζ ∈ ∂f (x) + εB X } = f ◦ (x; vi ) + εkvi k Debido a que es homogéneamente positiva, podemos tomar kvi k = 1, además se puede ver que la sucesión {ζi } está acotada. Como estamos en dimensión finita, podemos extraer un par de subsucesiones convergentes de {ζ} y {vi } tales que ζi → ζ y vi → v donde kvk = 1. Por lo tanto, tomando lı́mites en la desigualdad anterior tenemos: hζ, vi ≥ f ◦ (x; v) + ε Gradiente Generalizado en Espacios de Banach 8 Por la Proposición 1.4 tenemos que ζ ∈ ∂f (x). Luego esto contradice la parte (b). Por lo tanto se completa la prueba. 1.2. CÁLCULOS BÁSICOS En esta sección obtenemos una variedad de fórmulas que facilitan el cálculo de ∂f . Siempre vamos asumir que las funciones dadas son Lipschitz cerca del punto de interés, como veremos. Proposición 1.6. Para cualquier escalar λ, tenemos ∂(λf )(x) = λ∂f (x) Demostración. Note que λf es Lipschitz cerca de x, de constante |λ|K. Cuando λ es no-negativo, (λf )◦ = λf ◦ y el resultado se sigue inmediatamente. Para completar la prueba es suficiente considerar ahora el caso λ = −1. Un elemento ζ de X ∗ pertenece a ∂(−f )(x) si y solamente si, (−f )◦ (x; v) ≥ hζ, vi, para todo v. Por las propiedades de la Derivada Direccional Generalizada tenemos f ◦ (x; v) ≥ hζ, vi para todo v, esto es equivalente a −ζ ∈ ∂f (x), por la Proposición 1.2 (c) Ahora procedemos a examinar el gradiente generalizado de la suma de dos funciones f y g, donde cada una de ellas es Lipschitz cerca de x, y por tanto f + g es Lipschitz cerca de x. Nos gustarı́a relacionar ∂(f + g)(x) con ∂f (x) + ∂g(x). Para hacer esto introducimos una técnica que se utiliza muchas veces: para probar la inclusión entre dos conjuntos convexos cerrados, se hace probando la desigualdad equivalente entre sus funciones soportes. La función soporte de ∂(f + g)(x) evaluada en v, por definición es (f + g)◦ (x; v), mientras que la de ∂f (x) + ∂g(x) es f ◦ (x; v) + g ◦ (x; v) (la función soporte de la suma de conjuntos es la suma de las funciones soportes). Dado que la suma de dos conjuntos w∗ - compactos es w∗ - compacto, de esto deducimos la siguiente desigualdad general: (f + g)◦ (x; v) ≤ f ◦ (x; v) + g ◦ (x; v) y es equivalente a la inclusión ∂(f + g)(x) ⊂ ∂f (x) + ∂g(x), Gradiente Generalizado en Espacios de Banach 9 como se puede observar en la Proposición 1.2 (c) La extensión de esta inclusión (la regla de la suma) para combinaciones lineales finitas es inmediata. Proposición 1.7. Sean fi (i = 1, . . . n) Lipschitz cerca de x y λi (i = 1 . . . n) escalares. Entonces f := n P λi f i i=1 es Lipschitz cerca de x y se tiene que ∂ n X i=1 ! λi f i (x) ⊂ n X λi ∂fi (x) i=1 Teorema 1.1 (Teorema del Valor Medio de Lebourg). Sean x, y ∈ X, y supongamos que f es Lipschitz en un conjunto abierto que contenga el segmento [x, y]. Entonces existe un punto u en el segmento abierto (x, y) tal que f (y) − f (x) ∈ h∂f (u), y − xi Demostración. Para probar este teorema primero mostraremos un caso especial de la regla de la cadena. Denotemos por xt el punto x + t(y − x) Lema 1.2.1. La función g : [0, 1] → R definida por g(t) = f (xt ) es Lipschitz en (0, 1), y tenemos ∂g(t) ⊂ h∂f (xt ), y − xi Demostración. El hecho de que g es Lipschiz es fácil. Los dos conjuntos convexos cerrados que aparecen en la ecuación son de hecho intervalos en R. Luego es suficiente con probar para v = ±1, por lo que tenemos máx{∂g(t)v} ≤ máx{h∂f (xt ), y − xiv} Gradiente Generalizado en Espacios de Banach 10 Ahora el lado izquierdo es justamente g ◦ (t; v); esto es lı́m sup s→t λ↓0 g(s + λv) − g(s) λ = lı́m sup s→t λ↓0 ≤ lı́m sup y 0 →xt λ↓0 f (x + [s + λv](y − x)) − f (x + s(y − x)) λ f (y 0 + λv(y − x)) − f (y 0 ) λ = f ◦ (xt ; v(y − x)) = máxh∂f (xt ), v(y − x)i Con lo cual queda demostrado el lema. Ahora mostraremos el teorema. Consideremos la función θ en [0, 1] definida por θ(t) = f (xt ) + t[f (x) − f (y)]. Se puede ver que θ(0) = θ(1) = f (x), luego existe un punto t en (0,1) en donde θ alcanza un máximo o mı́nimo local (por la continuidad). Entonces 0 ∈ ∂θ(t). Ahora aplicando las Proposiciones 1.6, 1.7 y el lema 1.2.1 calculamos ∂θ(t). Luego deducimos 0 ∈ f (x) − f (y) + h∂f (xt ), y − xi, donde esto es precisamente lo que se afirma el teorema (tomando u = xt ). Teorema 1.2 (La regla de la Cadena). Sean F : X → Rn una función Lipschitz cerca de x, y g : Rn → R otra función Lipschitz cerca de F (x). Entonces la función f (x0 ) := g(F (x0 )) es Lipschitz cerca de x, y además tenemos ∂f (x) ⊂ co∗ {∂hγ, F (·)i(x) : γ ∈ ∂g(F (x))}, donde co∗ significa la envoltura convexa y w∗ - cerrada. Demostración. El hecho de que f sea Lipschitz es fácil de ver. Nuevamente se trata de mostrar la inclusión Derivadas 11 entre dos conjuntos convexos w∗ - compactos; la correspondiente desigualdad de la función soporte equivale a decir: para un determinado v, existen γ ∈ ∂g(F (x)), y ζ en el gradiente generalizado en x de la función x0 7→ hγ, F (x0 )i, tales que f ◦ (x; v) ≤ hζ, vi. Vamos a demostrar el teorema generando un par de funcionales γ y ζ. Para empezar, tomamos sucesiones yi → x y ti ↓ 0 y desarrollando el lı́mite superior de la definición de f ◦ (x; v) tenemos que: f (yi + ti v) − f (yi ) = f ◦ (x; v). i→∞ ti Aplicando el Teorema del Valor Medio 1.1, para cada i ∈ N, existe un elemento γi ∈ ∂g(zi ) tal que: lı́m f (yi + ti v) − f (yi ) g(F (yi + ti v)) − g(F (yi )) = ti ti F (yi + ti v) − F (yi ) = ζ, , ti donde zi se encuentra en el segmento de lı́nea que une a F (yi ) y F (yi + ti v). De esto se deduce que zi → F (x) y que para una adecuada subsucesión tenemos que γi → γ ∈ ∂g(F (x)) luego este es el γ requerido. Ahora buscaremos el ζ adecuado. Nuevamente aplicando el Teorema del Valor Medio 1.1, existe ζi ∈ ∂hγ, F (·)i(wi ) tal que F (yi + ti v) − F (yi ) γ, = hζi , vi ti donde wi esta en el segmento de linea que une a yi y yi + ti v. De esto se deduce que wi → x y que la sucesión {ζi } esta acotada en X ∗ , y que {hζi , vi} esta acotada en R. Si tomamos una subsucesión hζi , vi y sea ζ un w∗ - punto de acumulación de {ζi } entonces hζi , vi → hζ, vi por lo tanto ζ ∈ ∂hγ, F (·)i (Proposición 1.4). Combinando con lo anterior, llegamos a f (yi + ti v) − f (yi ) F (yi + ti v) − F (yi ) = (γi − γ) + γ, ti ti F (yi + ti v) − F (yi ) = (γi − γ), + hζi , vi. ti Ahora el término [F (yi + ti v) − F (yi )]/ti esta acotado ya que F es Lipschitz y sabemos que γi → γ y ahora tomando el lı́mite tenemos f (yi + ti v) − f (yi ) = hζ, vi, i→∞ ti lo que confirma que ζ cumple con las propiedades requeridas. f ◦ (x; v) = lı́m Derivadas 1.3. 12 RELACIÓN CON LAS DERIVADAS La Derivada Direccional de f en x en la dirección de v ∈ X esta definida como f 0 (x; v) = lı́m t↓0 f (x + tv) − f (x) t (1.2) cuando este lı́mite existe. Diremos que f es Gâteaux diferenciable en x siempre que el lı́mite en (1.2) exista para todo v en X, si este lı́mite existe para todo v ∈ X hay un elemento fG0 (x) ∈ X (llamado Derivada Gâteaux ) que satisface f 0 (x; v) = hfG0 (x), vi para todov ∈ X. (1.3) Una función puede poseer derivada direccional en todas las direcciones y sin embargo no posea una derivada Gâteaux, como se puede ver en f (x) = kxk en x = 0. En este caso, tenemos que f 0 (0, v) = kvk. Supongamos que (1.3) se tiene para un punto en x, y además, que la convergencia en (1.2) es uniforme con respecto a v en un subconjunto acotado de X. Decimos que f es Fréchet diferenciable en x, y en este caso se escribe f 0 (x) (la derivada de Fréchet) en lugar de fG0 (x). Equivalentemente esto significa que para todo r > 0 y ε > 0, existe δ > 0 de modo que f (x + tv) − f (x) 0 <ε − hf (x), vi t esto se tiene para todo |t| < δ y kvk ≤ r. Las dos nociones de diferenciabilidad no son equivalentes, incluso en dimensión finita. Es fácil ver que Fréchet diferenciable en x implica continuidad en x, que no es el caso de Gâteaux diferenciable. Diremos que f es continuamente (Gâteaux) diferenciable en x, siempre que en un entorno de x la derivada Gâteaux fG0 exista y sea continua como función de X en L(X, Y ) (con la topologı́a norma de operadores). A continuación mostraremos la relación entre las diversas derivadas definidas en esta sección y el Gradiente Generalizado. Proposición 1.8. Sea f Lipschitz cerca de x y admite una derivada Gâteaux (o Fréchet) fG0 (x). Entonces fG0 (x) ∈ ∂f (x) Si f es C 1 en x, entonces ∂f (x) = {f 0 (x)} Derivadas 13 Demostración. Por definición f 0 (x; v), existe para cada v, y equivale a hfG0 (x), vi, además por la definición de f 0 tenemos que f 0 ≤ f ◦ luego f ◦ (x; v) ≥ hfG0 (x), vi para todo v ∈ X. Por lo tanto (Proposición 1.3 (c)) fG0 (x) ∈ ∂f (x). Ahora supongamos que f es C 1 en una vecindad de x, y fijemos un v ∈ X. Para y cerca de x y t > 0 cerca de x, tenemos f (y + tv) − f (y) = hf 0 (z), vi t para algunos z ∈ (y, y + tv), por el clásico Teorema del valor medio. Como y → x y t ↓ 0, el punto z converge a x, y porque es f 0 (·) es continua (como una función entre espacios de Banach X y X ∗ ), tenemos f ◦ (x; v) ≤ hf 0 (x), vi. Se sigue de la Proposición 1.3 (c) que hζ, vi ≤ hf 0 (x), vi siempre que ζ ∈ ∂f (x). Ahora como v es arbitrario, concluimos que ∂f (x) es {f 0 (x)} Ejemplo 1.2. Sea φ : [0, 1] → R que pertenece a L∞ [0, 1] y definimos la función (Lipschitz) f : [0, 1] → R por Z x f (x) = φ(t) dt. 0 − Probar que ∂f (x) es el intervalo [φ (x), φ (x)], donde φ− (x) y φ+ (x) son el ı́nfimo esencial y el supremo esencial, respectivamente, de φ en x. Definimos el supremo esencial por: + φ+ := ı́nf{M : ∃ε > 0 3 φ(x0 ) ≤ M a.e. para x0 ∈ [x − ε, x + ε]} y el ı́nfimo esencial por: φ− := sup{M : ∃ε > 0 3 φ(x0 ) ≥ M a.e. para x0 ∈ [x − ε, x + ε]} Sabemos que f es diferenciable en casi todo x, con f 0 (x) = φ(x); para dicho x, se tiene que φ(x) ∈ ∂f (x) por la Proposición 1.8. De esto y de la semicontinuidad superior (ver Proposición 1.4) se sigue que todo punto de acumulación esencial (es decir, aquellos que persisten al quitar conjuntos de medida cero) pertenece a ∂f (x). De lo anterior y del hecho que ∂f (x) es convexo implica que ∂f (x) contiene el intervalo [φ− (x), φ+ (x)]. Ahora de la igualdad Z y+t f (y + t) − f (y) = φ(s) ds y Funciones Convexas 14 se puede ver que f ◦ (x; 1) esta acotado por arriba por φ+ (x). Además, cualquier ζ en ∂f (x) satisface f ◦ (x; v) ≥ 1ζ, por la Proposición 1.3(c), se obtiene ζ ≤ φ+ (x). De forma similar se obtiene ζ ≥ φ− (x). Luego ∂f (x) = [φ− (x), φ+ (x)] 1.4. FUNCIONES CONVEXAS Una función real f definida en un subconjunto convexo U de X se denomina convexa siempre que para cada par de puntos x, y ∈ U se tiene f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y) para todo t ∈ [0, 1] Proposición 1.9. Sea f una función convexa en U y Lipschitz cerca de x ∈ U . Entonces existe la derivada direccional f 0 (x; v) = f ◦ (x; v). Un vector ζ pertenece a ∂f (x) si, y solamente si, f (y) − f (x) ≥ hζ, y − xi para todo y ∈ U Demostración. Se sigue directamente de la definición de función convexa que para t > 0 pequeño, la función t 7→ f (x0 + tv) − f (x0 ) t es no-decreciente. Este hecho, junto con la hipótesis de Lipschitz, implica la existencia y la finitud de de la derivada direccional para todo x0 cerca x, para todo v: f (x0 + tv) − f (x0 ) t>0 t f 0 (x; v) = ı́nf Ahora si fijamos un δ > 0 se puede escribir f ◦ (x; v) de la siguiente forma f ◦ (x; v) = lı́m sup ε↓0 kx0 −xk≤εδ f (x0 + tv) − f (x0 ) t 0<t<ε sup De lo anterior se puede ver una expresión alternativa para f ◦ (x; v) lı́m ε↓0 f (x0 + εv) − f (x0 ) ε kx0 −xk≤εδ sup Funciones Convexas 15 Si K es una constante Lipschitz de f cerca de x, entonces para todo x0 en x + εδBX y para todo ε suficientemente pequeño, tenemos f (x0 + εv) − f (x0 ) f (x + εv) − f (x) ≤ 2δK, − ε ε ası́ que ◦ f (x; v) ≤ lı́m ε↓0 f (x + εv) − f (x) + 2δK ε = f 0 (x; v) + 2δK. Como δ es arbitrario deducimos que f ◦ (x; v) ≤ f 0 (x; v), y por lo tanto la igualdad, ya que naturalmente f ◦ ≥ f 0 . Finalmente observamos ζ ∈ ∂f (x) ⇐⇒ f ◦ (x; v) ≥ hζ, vi para todo v, ⇐⇒ f 0 (x; v) ≥ hζ, vi para todo v, f (x + tv) − f (x) ≥ hζ, vi para todo v, t>0 t ⇐⇒ f (y) − f (x) ≥ hζ, y − xi para todo y ∈ U. ⇐⇒ ı́nf La proposición anterior es equivalente a mostrar: Proposición 1.10. Si f es convexa en U y Lipschitz cerca de x, entonces ∂f (x) coincide con la subdiferencial en x en el sentido del análisis convexo, y f ◦ (x; v) coincide con la derivada direccional f 0 (x; v) para cada v. Ejemplo 1.3. Vamos a determinar el gradiente generalizado de la función f : Rn → R definido por f (x1 , x2 , . . . xn ) = máx{xi : i = 1, 2, . . . , n}. Podemos ver que f es convexa, por ser un máximo de funciones lineales; detonemos por I(x) el conjunto de los indices i los cuales xi = f (x) es decir, los indices para el cual este máximo Funciones Convexas 16 se alcanza. Ahora procedemos a calcular f 0 (x; v). {xi + tvi } − f (x) i t↓0 t {xi + tvi } − f (x) = lı́m máx t↓0 i ∈ I(x) t {xi + tvi − xi } = lı́m máx t↓0 i ∈ I(x) t f 0 (x; v) := lı́m máx = máx vi . i ∈ I(x) Ya que f ◦ y f 0 coinciden (Proposición 1.10), ∂f (x) consiste en los vectores ζ en Rn que satisfacen máx vi ≥ ζ · v, para todo v en Rn i ∈ I(x) Por lo tanto ∂f (x) consiste en todos los vectores (ζ1 , ζ2 , . . . , ζn ) tales que ζi ≥ 0, P ζi = 1, ζi = 0 si i ∈ / I(x) CÁLCULO DEL GRADIENTE EN DIMENSIÓN FINITA Recordemos el celebre Teorema de Rademacher. Teorema 1.3 (Teorema de Rademacher ). Sea U un subconjunto cerrado y no-vacı́o de Rn y supongamos que f : U → Rm es localmente Lipschitz. Entonces f es (Fréchet) diferenciable en casi todo punto de U (en el sentido de la medida de Lebesgue). El siguiente teorema facilita el cálculo de ∂f (x) en dimensión finita. Teorema 1.4. Sean f Lipschitz cerca de x y Ωf el conjuntos de puntos donde f no es diferenciable y supongamos que S es cualquier subconjunto de medida Lebesgue cero en Rn entonces ∂f (x) := co{lı́m ∇f (xi ) : xi → x, xi ∈ / S, xi ∈ / Ωf }. El significado de esto es considerar cualquier sucesión {xi } que converge a x y donde xi ∈ / S ∪ Ωf tal que la sucesión {∇f (xi )} converge; entonces la envoltura convexa de todos estos lı́mites es ∂f (x). Funciones Convexas 17 Demostración. Tengamos en cuenta en primer lugar que hay “muchas” sucesiones {xi } que convergen a x y no pertenecen a S ∪ Ωf puesto que este conjunto tiene medida cero cerca de x. Además, como ∂f (x) es localmente acotada cerca de x (Proposición 1.3) y como f es Lipschitz y admite derivada entonces ∇f (xi ) ∈ ∂f (xi ) (Proposición 1.8) para cada i, por el teorema de Bolzano-Weierstrass la sucesión {∇f (xi )} admite una subsucesión convergente. Por lo tanto el limite de cualquier sucesión de este tipo debe pertenecer a ∂f (x) por la propiedad de cierre de ∂f . Por lo tanto el conjunto {lı́m ∇f (xi ) : xi → x, xi ∈ / S, xi ∈ / Ωf } está contenido en ∂f (x) y es no-vacı́o y acotado, y como es cerrado tenemos que es compacto. Por otro lado como ∂f (x) es convexo, deducimos que la parte izquierda esta contenida en la parte derecha. Ahora como la envoltura convexa de un conjunto compacto en Rn es compacto, para completar la prueba debemos demostrar que la función soporte de la izquierda nunca excede a la de la parte derecha. Esto se sigue a partir del siguiente lema. Lema 1.4.1. Para cualquier v 6= 0 en Rn , y para cualquier ε > 0 tenemos f ◦ (x; v) − ε ≤ lı́m sup{∇f (y) · v : y → x, y ∈ / S ∪ Ωf } Para demostrar esto, denotaremos por α el lado derecho. Entonces por definición, existe δ > 0 tal que si y ∈ x + δBX , y ∈ / S ∪ Ωf implica que ∇f (y) · v ≤ α + ε. Ahora sea N = S ∩ Ωf y elegimos un δ suficientemente pequeño y µ(N ) = 0 en x + δBX , consideremos el segmento de lı́nea o n para que f sea Lipschitz δ Ly = y + tv : 0 < t < 2|v| y el conjunto A = y ∈ B x, 2δ : λ(Ly ∩ N ) = 0 . Tenemos que ver que λ(Ly ∩N ) = 0, para lo cual mostraremos que A es denso B(x, δ/2). Supondremos que A no es denso, entonces existe BX ⊂ B(x, δ/2)rA, donde BX es una bola abierta, y BX 6= ∅. Consideremos el hiperplano H ⊂ Rn y es perpendicular a v. Si definimos B0 = H ∩ BX una bola abierta en H y B0 6= ∅, luego µn−1 (H ∩ BX ) > 0, y H ∩ BX es una bola (n − 1) Funciones Convexas 18 dimensional. Ahora para todo y ∈ B0 , {y} × Ly ⊂ B(x, δ/2) se tiene que: " #! [ µ(N ) >µ N ∩ {y} × Ly y∈B0 Z = Z B0 λ(Ly ∩ N ) dλ dµn−1 Ly Z ≥ λ(Ly ∩ N ) dµn−1 > 0 B0 como µ(N ) = 0 y R λ(Ly ∩ N ) dµn−1 > 0 tenemos que λ(Ly ∩ N ) = 0. Ahora como sabemos B0 que para casi todo y ∈ x + (δ/2)BX el segmento de lı́nea Ly interseca a N en un conjunto de medida cero uno-dimensional. Sean y cualquier punto en x + (δ/2)BX con la propiedad anterior, y t ∈ (0, δ/2|v|), entonces Z f (y + tv) − f (y) = t ∇f (y + sv) · vds, 0 f 0 existe almenos casi siempre en Ly . Ahora como tenemos ky + sv − xk < δ para 0 < δ < t, se sigue que ∇f (y + sv) · v ≤ α + ε por consiguiente f (y + tv) − f (y) ≤ t(α + ε). Dado que esto es cierto para todo y que diste δ/2 de x excepto en un conjunto de medida cero, y para todo t ∈ (0, δ/2|v|), y como f es continua, esto es verdadero para todo y y t. Luego f ◦ (x; v) ≤ α + ε Ejemplo 1.4. Sea f : R2 → R dada por f (x, y) = máx{mı́n[x, −y], y − x}. Funciones Convexas 19 Calcular ∂f (0, 0). Definamos C1 ={(x, y) : y ≤ 2x e y ≤ −x} C2 ={(x, y) : y ≤ x/2 e y ≥ −x} C3 ={(x, y) : y ≥ 2x o y ≥ x/2}. Luego C1 ∪ C2 ∪ C3 = R2 , y obtenemos x, para (x, y) ∈ C1 f (x, y) = −y, para (x, y) ∈ C2 y − x, para (x, y) ∈ C3 Se puede ver que el lı́mite de estos tres conjuntos forman un conjunto S de medida 0, y que si (x, y) no esta en S, entonces f es diferenciable y ∇f (x, y) es uno de los puntos (1, 0), (0, −1), o (−1, 1). Por lo tanto, del Teorema 1.4 se sigue que ∂f (0, 0) es la envoltura convexa de estos tres puntos. Capı́tulo 2 JACOBIANO GENERALIZADO Y TEOREMA DE LA FUNCIÓN INVERSA En este capı́tulo estudiaremos el clásico Teorema de función inversa, el cual nos proporciona condiciones para que una función f admita (localmente) una inversa. Nuestro propósito está en buscar condiciones para que una función Lipschitz (no necesariamente diferenciable) admita (localmente) una función inversa y que sea Lipschitz. Una forma conveniente para el cálculo de esta función inversa, es el Gradiente Generalizado propuesto por Clarke [6]. 2.1. JACOBIANO GENERALIZADO Consideremos una función vectorial f : Rn −→ Rm , escrita en componentes de la forma f (x) = [f 1 (x), f 2 (x), . . . , f m (x)]. Ası́ mismo asumimos que cada f i es Lipschitz cerca de un punto de interés x. Al igual que antes el Teorema de Rademacher nos dice que f es diferenciable (es decir cada f i es diferenciable) en casi todo punto en donde f es Lipschitz. Denotamos por Ωf el conjuntos de puntos donde f no es diferenciable y f 0 (y) la matriz jacobiana usual n × m de derivadas parciales siempre que y sea un punto donde la derivada parcial exista. Definición 2.1. El Jacobiano Generalizado de Clarke de f en x, denotado ∂f (x), es la envoltura convexa de todas las matrices M obtenidas como el lı́mite de una sucesión de la forma f 0 (xi ) cuando 20 Jacobiano Generalizado en Espacios de Banach xi → x y xi ∈ / Ωf De esta manera, tenemos que: ∂f (x) = co{lı́m f 0 (xi ) : xi → x, xi ∈ / Ωf }. Ahora denotamos por M el espacio vectorial de matices de m × n dotado por la norma ( m ) 21 X kM km×n = |ri |2 : ri es la i − esima fila de M , i=1 y Bm×n la bola de unidad abierta en Rm×n . A continuación damos algunas propiedades de ∂f (x). Proposición 2.1. (a) ∂f (x) es un subconjunto de Rm×n no-vacı́o, convexo y compacto. (b) ∂f es cerrado en x; estos es, si xi → x, Mi → M, entonces M ∈ ∂f (x). (c) ∂f es semicontinua superiormente en x, esto es, para cualquier ε > 0 existe un δ > 0 tal que, para todo y ∈ x + δBX , ∂f (y) ⊂ ∂f (x) + εBm×n (d) Si cada función componente f i es Lipschitz de constante Ki en x, entonces f es Lipschitz en x de constante K = |(K1 , K2 , . . . , Km )|, y ∂f (x) ⊂ K Bm×n (c) ∂f (x) ⊂ ∂f 1 (x) × ∂f 2 (x) × · · · × ∂f m (x), donde este último representa el conjunto de todas las matrices cuya i- esima fila pertenece a ∂f i (x) para cada i. Si m = 1, entonces ∂f (x) = ∂f 1 (x) (es decir, el Gradiente Generalizado y el Jacobiano Generalizado coinciden) Ahora se debe hacer notar que ∂f (x) no es en realidad un subconjunto de Rn (cuando f : Rn → R) como se ha pretendido hasta ahora. Para ser coherente con el Jacobiano Generalizado, ∂f esta conformada por matrices de 1×n (i.e., vectores filas). Por otra parte, la convención habitual que tiene los operadores lineales de Rn en Rm son de la forma f (x) = Ax, y son representados por multiplicación, en donde A es una matrix de m×n, esto es lo que nos hace ver a Rn como matrices de n × 1 (i.e., vectores columna), y ası́ obtenemos ∂f (x) = {A} como nosotros desearı́amos. Esta distinción es irrelevante, siempre y cuando permanezcamos en el caso m = 1, pero debe respetarse en la interpretación. 21 Jacobiano Generalizado en Espacios de Banach 22 Demostración. Las afirmaciones (a) y (b) se siguen fácilmente, de la primera parte de la prueba del teorema 1.4. Ahora, podemos notar que la parte (c) incluye a (b). Por lo tanto procedemos a demostrar (c), supongamos que, para un ε dado, no existe δ. Entonces (como la parte izquierda es convexa), para cada i ∈ N, existe necesariamente un elemento f 0 (yi ) tal que yi ∈ x + (1/i)BX aunque f 0 (yi ) ∈ / ∂f (x) + εBm×n . Ahora como ∂f es acotado localmente podemos suponer que ∂f (yi ) converge a un elemento M , y por definición, M ∈ ∂f (x), lo que nos lleva a una contradicción. Para la afirmación (e) es consecuencia inmediata de la definición de ∂f y el Teorema 1.4 Este termino es introducido por Clarke [6] para estudiar el control óptimo y problemas variacionales con datos No-regulares, esta noción y variaciones de la misma se han utilizado en los últimos años para ampliar los resultados en programación lineal, control óptimo y análisis global. Se puede consultar por ejemplo Clarke [5, 6], Halkin [11, 12], Hiriart-Urruty [14, 15] o Pourciau [20, 23]. Las cuentas en detalle de las propiedades básicas se pueden encontrar en Clarke [6] o Pourciau [20]. A continuación mostraremos una extensión del teorema del valor medio vectorial. Proposición 2.2. Sea f una función lipschitz en un conjunto abierto convexo U en Rn , y sean x e y dos puntos de U . Entonces f (y) − f (x) ∈ co ∂f ([x, y])(y − x) Demostración. Cabe recordar que la parte derecha denota la envoltura convexa, de todos los puntos de la forma Z(y − x), donde Z ∈ ∂f (u) para algún punto u ∈ [x, y] y se puede hacer (esto no es una anbigüedad) [co ∂f ([x, y])] (y − x) = co [∂f ([x, y])(y − x)]. Ahora fijemos un x. Basta con probar esta inclusión para puntos y teniendo la propiedad que el segmento de linea [x, y] interseca al conjunto Ωf en un conjunto de medida cero uno-dimensional, por un argumento utilizado en la demostración del lema 1.4.1, casi todo y tiene esta propiedad y por la continuidad de f y la semicontinuidad de ∂f , para tal y, podemos escribir Z 1 f (y) − f (x) = f 0 (x + t(y − x))(y − x) dt, 0 Jacobiano Generalizado en Espacios de Banach 23 que expresa directamente a f (y) − f (x) como una (por la continuidad) combinación convexa de puntos de la forma ∂f ([x, y])(y − x). Comparando el enunciado del Teorema 1.4 y la definición de el Jacobiano Generalizado de Clarke, nos podemos dar cuenta que podemos quitar el conjunto S. De hecho, aunque el gradiente generalizado Clarke es “ciego” a conjuntos de medida cero, como se prueba en el teorema 1.4, esto también es cierto para el Jacobiano Generalizado de Clarke (en el caso de m = 1). Clarke habı́a pensado que para m > 1 no funcionarı́a para el Jacobiano Generalizado, y hacia la observación que, posiblemente (aunque no estaba seguro) que alterando la definición en donde los puntos xi también estén restringidos a estar fuera del conjunto nulo S, pero esto nos conducirı́a a un Jacobiano Generalizado diferente. M. Fabian y D. Preiss son quienes muestran que también se cumple para m > 1. Lema 2.1. Supongamos que U es un subconjunto de Rn , que h es una función Lipschitz continua de U en Rn , y que S es un subconjunto de U con n- medida Lebesgue dimensional µ(S) = 0. Entonces, µ(hS) = 0 Demostración. Denotemos por M la constante Lipschitz de la función h, y fijemos un ε > 0. Como µ(S) = 0 y S esta contenido en la unión S∞ Cj de una sucesión de cubos Cj con ! ∞ ∞ \ X Cj ≤ µ(Cj ) < ε. j=1 µ j=1 j=1 Se puede ver fácilmente que h(S ∩ Cj ) esta contenido en un cubo Dj satisfaciendo µ(Dj ) ≤ M n µ(Cj ) S de este modo h(S) esta cubierto por la union ∞ j=1 Dj de cubos Dj tal que ! ∞ ∞ ∞ [ X X µ Dj ≤ µ(Dj ) ≤ M n µ(Cj ) < M n ε. j=1 j=1 j=1 Jacobiano Generalizado en Espacios de Banach 24 Como ε es arbitrario, tenemos que µ(hS) = 0 Sea f : Rn −→ Rm una función localmente Lipschitz, se sabe que por el Teorema de Rademacher que existe un conjunto Ωf ⊂ Rn de medida Lebesgue cero tal que la derivada Gâteaux fG0 (y) existe siempre que y ∈ / Ωf . Si reemplazamos al conjunto Ωf por un conjunto nulo E ∈ Rn conteniendo a Ωf se obtiene el siguiente teorema Teorema 2.1. (M. Fabian y D. Preiss) Sean f : Rn −→ Rm una función localmente Lipschitz y ∂E f (x) el Jacobiano Generalizado de f en x con respecto a E definido por ∂E f (x) = co{lı́m f 0 (xi ) : xi → x, xi ∈ / E}, entonces ∂E f (x) = ∂f (x) para todo m y para todo conjunto nulo E incluyendo a Ωf Demostración. Todo los espacios Rk son considerados con la norma Euclı́dea k · k. Denotamos por h·, ·i el producto interior usual. El espacio de las funciones lineales de Rn en Rm ası́ como su dual será identificado con Rnm . Claramente tenemos que ∂E f (x) ⊂ ∂f (x), luego procedemos a demostrar la otra inclusión. Lo haremos por contradicción, supongamos que esta inclusión es propia. Entonces existe un funcional A en Rnm y α ∈ R tal que sup{hA, Li : L ∈ ∂E f (x)} < α < sup{hA, Li : L ∈ ∂f (x)}, de la definición de ∂E f (x) tenemos que existe un ε > 0 tal que: hA, fG0 (y)i < α cuando y ∈ B(x, ε) r E. De lo contrario, podrı́a ocurrir que yi ∈ B(x, 1/i) r E donde hA, fG0 (yi )i ≥ α y por lo tanto existirı́a un L ∈ ∂E f (x) tal que hA, Li ≥ α, que es imposible. Además, si recordamos la definición de ∂f (x), existe y = (y 1 , . . . , y n ) ∈ B(x, ε) r S donde α < hA, fG0 (y)i. Jacobiano Generalizado en Espacios de Banach 25 Uniendo las dos últimas desigualdades obtenemos hA, fG0 (y)i < α < hA, fG0 (y)i donde y ∈ B(x, ε) r E. Denotando por A = (aij ), i = 1, . . . , m, j = 1, . . . , n y gj = a1j f1 + . . . + akj fk , j = 1, . . . , n, podemos escribir la anterior desigualdad de la siguiente forma n X ∂gj (y) j=1 ∂yj <α< n X ∂gj (y) j=1 ∂yj , donde y ∈ B(x, ε) r E. Sea C(s) el cubo n- dimensional con vertices (y 1 ± s, . . . , y n ± s). Como s > 0 es tan pequeño se tiene que C(s) ⊂ B(x, ε), luego la desigualdad anterior se mantiene en casi toda punto de C(s) y, en consecuencia, Z n n X X ∂gj (y) ∂gj (y) n n dy1 . . . dyn < (2s) α < (2s) . ∂yj ∂yj j=1 j=1 C(s) Ahora denotemos por 0 δj (s) = sup |gj (y) − gj (y) − gGj (y)(y − y)| : máx |yi − y i | ≥ s i=1,...,n y Cj (s) = (y1 , . . . , yj−1 , yj+1 , . . . , yn ) : (y1 , . . . , yj−1 , y j , yj+1 . . . , yn ) ∈ C(s) , j = 1, . . . , n, s > 0. (2.1) Teorema de la Función Inversa 26 Usando el teorema de Fubini, obtenemos lo siguiente Z ∂gj (y) dy1 . . . dyn = ∂yj C(s) Z X σgj (y1 . . . , yj−1 , y j + σs, yj+1 , . . . , yn ) × dy1 . . . dyj−1 dyj+1 . . . dyn = Cj (s) Z Cj (s) σ=±1 X σ gj (y1 . . . , yj−1 , y j + σs, yj+1 , . . . , yn ) − gj (y)− σ=±1 0 (y)(y1 gG j − y 1 , . . . , yj−1 − y j−1 , σs, yj+1 − y j+1 , . . . yn − y n dy1 . . . dyj−1 dyj+1 . . . dyn ≥ −2(2s)n−1 δj (s) + 2s i ∂gj (y) + 2s ∂yj × ∂gj (y) (2s)n−1 . ∂yj Por lo tanto de 2.1 tenemos 2(s)n n X ∂gj (y) j=1 ∂yj − (2s)n n X δj (s)/s < (2s)n α < (2s)n j=1 n X ∂gj (y) j=1 ∂yj si s > 0 es suficientemente pequeño. Tengamos en cuenta que δj (s)/s → 0 cuando s ↓ 0 ya que para funciones Lipschitz en espacios de dimensión finita, Gâteaux y Fréchet diferenciable coinciden. Ahora, dividiendo la desigualdad anterior por (2s)n y dejando que s se acerque a cero, obtenemos una contradicción. 2.2. TEOREMA DE LA FUNCIÓN INVERSA Sea f : Rn −→ Rn y denotemos como M al espacio vectorial de matrices n × n dotado de la norma kM k = máx |mij | siendo M = (mij )i,j=1,...n ∈ M. El conjunto M(0, 1) es la bola centrada en la matriz 0 ∈ M de radio 1 con la norma anterior. El Jacobiano Generalizado de f en x0 , es el convexo más pequeño que contiene a todas las matrices M de la forma M = lı́m f 0 (xt ) t→∞ donde {xt } es una sucesión de puntos en los que existe f 0 (xt ) y converge a x0 . La existencia de xt es una consecuencia del teorema de Rademacher, aplicándolo a las funciones componentes de f . Además, como f es K-Lipschitz entonces f 0 (x) está acotado cerca de x0 . Teorema de la Función Inversa 27 Proposición 2.3. Sea h : R → R una función Lipschitz, si para algún ζ ∈ Rn y para todo v ∈ Rn se tiene ζ · v ≤ lı́m sup δ→0 h(x + δv) − h(x) δ entonces ζ ∈ ∂h(x) Demostración. Véase el corolario 1.10 de [6] Definición 2.2. Sean f : Rn → R y x0 ∈ Rn . Se dice que ∂f (x0 ) es de rango máximo si cada M ∈ ∂f (x0 ) es de rango máximo. Ahora procedemos a mostrar el Teorema principal de este capı́tulo. Teorema 2.2. (Teorema de la Función Inversa) Sean f : Rn → R y x0 ∈ Rn . Si ∂f (x0 ) es de rango máximo, entonces existen entornos U y V de x0 y f (x0 ) respectivamente, y una función g : V → Rn Lipschitz tal que (a) g(f (u)) = u para todo u ∈ U (b) f (g(v)) = v para todo v ∈ V. Cuando f es C 1 , ∂f (x0 ) se reduce a f 0 (x0 ), y la función g es necesariamente C 1 . Con esto se recupera el teorema clásico. Para mostrar este teorema mostraremos primero 5 lemas. Lema 2.2.1. Sea ε > 0, entonces existe δ > 0 para todo x tal que kx − x0 k < δ se tiene que ∂f (x) ⊂ ∂f (x0 ) + εM(0, 1), siendo M(0, 1) la bola de centro 0 ∈ M y radio 1. Demostración. Supongamos que la tesis no es cierta, entonces existe ε > 0 tal que para todo i ∈ N existe xi (para el que existe f 0 (xi )) tal que kxi − x0 k < 1i de modo que f 0 (xi ) ∈ / ∂f (x0 ) + εM(0, 1) Teorema de la Función Inversa 28 Como f es Lipschitz entonces ∂f es localmente acotado y por lo tanto f 0 (xi ) converge a cierto M que por definición debe pertenecer a ∂f (x0 ). Luego esto contradice que f 0 (xi ) ∈ / ∂f (x0 ) + εM(0, 1), por lo tanto se verifica el lema. Lema 2.2.2. Si h : Rn → Rn es una función C 1 entonces ∂(h ◦ f )(x) ⊂ ∇h(f (x))∂f (x) Demostración. Por la definición 2.1 podemos escribir que ∂(h ◦ f )(x) es el convexo más pequeño que contiene a los lı́mites L = lı́m ∇(h ◦ f )(xn ) n→∞ siendo {xn } una sucesión convergente a x para la que existe ∇(h ◦ f ). Ası́ pues, se tiene L = lı́m ∇(h ◦ f )(xn ) = lı́m ∇(h(f (xn ))f 0 (xn ) = ∇h(f (x)) lı́m f 0 (xn ) = ∇h(f (x))M n→∞ n→∞ n→∞ donde M = lı́m f 0 (xn ) ∈ ∂f (x), por lo que se concluye que L ∈ ∇h(f (x))∂f (x) y por lo n→∞ tanto se concluye que ∂(h ◦ f )(x) ⊂ ∇h(f (x))∂f (x). Lema 2.2.3. Existen r > 0 y δ > 0 que verifican que dado cualquier vector unitario v ∈ Rn , existe w ∈ Rn unitario tal que si x ∈ x0 + rBX y M ∈ ∂f (x0 ) entonces w · (M v) ≥ δ Demostración. Como S y ∂f (x0 ) son compactos, entonces el conjunto ∂f (x0 )S = {u = M z ∈ Rn : M ∈ ∂f (x0 ), z ∈ S} es compacto ya que es la imagen mediante la aplicación continua M × Rn → Rn (M, z) 7→ M z como ∂f (x0 ) es de rango máximo, entonces si M ∈ ∂f (x0 ) entonces M v 6= 0 para todo v ∈ Rn con v = 6 0, y ası́ ∂f (x0 )S no contiene al vector 0 ∈ Rn . Como ∂f (x0 )S es Teorema de la Función Inversa 29 compacto, la norma euclı́dea en Rn restringida a ∂f (x0 )S alcanza su máximo y su mı́nimo. Sea δ0 = mı́n kzk, entonces tomamos δ tal que 0 < δ < δ20 . Por otro lado, si consideramos z∈∂f (x0 )S M0 = (mij )i,j=1...n ∈ M(0, 1) y ε > 0, tenemos que cualquier v ∈ S n P m v j=1 1j j .. M0 v = . n P mnj vj j=1 y por lo tanto v v v 2 2 u u u n uX uX n n n n X X uX √ u u t t mij vj ≤ε |vj | ≤ εt n2 = εn n kεM0 vk = εkM0 vk = ε i=1 j=1 i=1 j=1 (2.2) i=1 donde hemos utilizado que |mij | ≤ 1 y |vj | ≤ 1. Ası́ tomando ε < M ∈ ∂f (x0 ), M0 ∈ M(0, 1) y v ∈ S entonces δ √ n n kεM0 vk + kM v + εM0 vk ≥ kM vk ≥ δ0 > 2δ tenemos que si (2.3) y aplicando la desigualdad (2.2) tenemos que √ δ √ kεM0 vk ≤ εn n < √ n n = δ n n Ası́, combinándolo con la desigualdad (2.3) δ + kM v + εM0 vk ≤ kεM0 vk + kM v + εM0 vk > 2δ y por tanto kM v + εM0 vk > 2δ − δ = δ. Hemos visto que existe ε > 0 tal que kM v +εM0 vk > δ para todo M ∈ ∂f (x0 ), M0 ∈ M(0, 1) y v ∈ S, por tanto, esto implica que si llamamos G = ∂f (x0 ) + εM(0, 1), entonces GS está a una distancia mayor que δ del vector 0 ∈ Rn . Por el lema 2.2.1 tenemos que existe un entorno U de x0 tal que para todo x ∈ U se verifica que ∂f (x) ⊂ ∂f (x0 ) + εM(0, 1) = GS, y podemos considerar otro entorno V de x0 tal que V ⊂ U y además tal que V = x0 + rBX = {x0 + ru : u ∈ BX } Teorema de la Función Inversa 30 para cierto r > 0. Podemos suponer, sin perdida de generalidad tomando r más pequeño si fuese necesario, que ∂f (x) ⊂ G para todo x ∈ V . Consideramos v ∈ S, entonces como Gv es convexoentonces por el teorema de Hand-Banach, existe un vector w ∈ Rn − Gv tal que Gv está en un semiplano cerrado asociado a w, es decir que w · γv ≥ δ para todo γv ∈ Gv. Como hemos visto que ∂f (x) ⊂ G cuando x ∈ V = x0 + rBX entonces, si M ∈ ∂f (x) tenemos que w · (M v) ≤ δ. En esta demostración se ve claramente que el vector w ∈ Rn − Gv no depende del punto x sino únicamente del vector v. Lema 2.2.4. Sean x, y ∈ x0 + rBX , entonces kf (x) − f (y)k ≤ δkx − yk Demostración. Sean x, y ∈ Rn distintos y supongamos que x, y ∈ rBX . Denotemos por y−x v= ky − xk λ = ky − xk por consiguiente podemos escribir que y = x + λv Ahora considerando el hiperplano π perpendicular al vector v que pasa por x. Por el teorema de Rademacher nos lleva a que el conjunto de puntos P = {z ∈ x0 + rBX : no existe f 0 (z)} es un conjunto de medida cero, y por el teorema de Fubini para casi todo x0 ∈ π los puntos x0 + tv con t ≤ 0 interseca a P en un conjunto de medida 0. Tomando un punto cualquiera de estos x0 suficientemente cercano a x tal que x0 + tv pertenezca a x0 + rBX para todo t ∈ [0, λ] y consideramos la función dada por t 7−→ f (x0 + tv) se puede ver fácilmente que es K-Lipschitz (por ser f K-Lipschitz y v unitario), en efecto kf (x0 + tv) − f (x0 + sv)k ≤ K · kx0 + tv − x0 − svk = K · k(t − s)vk ≤ Teorema de la Función Inversa 31 K · k(t − s)k · kvk = K · k(t − s)k además la derivada de esta función es f 0 (x0 +tv)v en casi todo punto, y por lo tanto, integrando se tiene que Z λ 0 0 f 0 (x0 + tv)v dt f (x + λv) − f (x ) = 0 n Por el lema 2.2.3 existe un vector unitario w ∈ R tal que w · [f 0 (x0 + tv)v] ≥ δ y por tanto 0 0 Z w · [f (x + tv) − f (x )] = λ 0 0 Z λ w · [f (x + tv)v] dt ≥ 0 δ dt = δλ = δ ky − xk 0 es decir w · [f (x0 + tv) − f (x0 )] ≥ δ ky − xk y como w · [f (x0 + tv) − f (x0 )] ≥ kwk kf (x0 + tv) − f (x0 )k = kf (x0 + tv) − f (x0 )k entonces tenemos que kf (x0 + tv) − f (x0 )k ≥ δ ky − xk esto es cierto para todo x0 suficientemente cerca a x. Ahora por la continuidad de f se tiene que también será cierto para x = x0 , ası́ kf (x0 + tv) − f (x)k ≥ δ ky − xk y como y = x + tv entonces se concluye que kf (y) − f (x)k ≥ δ ky − xk Lema 2.2.5. W = f (x0 ) + rδ BX ⊂ f (x0 + rBX ) 2 Teorema de la Función Inversa 32 Demostración. Consideremos un y ∈ W y sea x ∈ x0 + rBX el punto donde la función ky − f (·)k alcanza su mı́nimo. Ahora supongamos que x ∈ x0 + rS, entonces por el lema 2.2.4 se tiene que rδ > ky − f (x0 )k ≥ kf (x) − f (x0 )k − ky − f (x)k ≥ 2 rδ rδ = 2 2 lo que es una contradicción, por lo que entonces se debe verificar que x ∈ x0 + rBX δ kx − x0 k − ky − f (x)k ≥ δ − ky − f (x0 )k ≥ δr − Con la ayuda de estos cinco teoremas procedemos a demostrar el teorema 2.2 Demostración. (Teorema 2.2) Sea x el mı́nimo de ky − f (·)k2 luego sus derivadas parciales son nulas y por lo tanto, por la proposición 2.3, tenemos que 0 ∈ ∂ (ky − f (·)k2 ). Luego por el lema 2.2.2, tenemos que 0 ∈ 2ky − f (x)k∂f (x). Y por el lema 2.2.3, implica que las matrices de ∂f (x) son invertible, por lo tanto y = f (x). Ası́ podemos definir en W = f (x0 ) + rδ2 BX la función g tal que para cada v, g(v) es el único x ∈ x0 + rBX tal que f (x) = v. Y por el lema 2.2.4 tenemos kf (y) − f (x)k ≥ δ ky − xk y esto es equivalente a ku − vk ≥ δ kg(u) − g(v)k luego 1 kg(u) − g(v)k ≤ ku − vk δ por lo tanto concluimos que g es Lipschitz. Capı́tulo 3 INVERSIÓN GLOBAL DE FUNCIONES NO-REGULARES Hadamard en 1906 establece el criterio de inversion global de funciones f continuamente diferenciables de Rn en Rn : Teorema 3.1. Teorema de Hadamard Sea f : Rn → Rn de clase C 1 tal que f 0 (x) es invertible para cada x en Rn y supongamos que Z ∞ ı́nf (1/kf 0 (x)−1 k) dt = ∞ 0 |x|≤t Entonces la función f es un difeomorfismo de Rn en Rn En el presente capı́tulo, se establece la generalización del teorema de Hadamard donde es valido para cierto tipo de funciones no-regulares de Rn en Rn . Si f es solo localmente Lipschitz, (esta clase de funciones incluye, por supuesto, funciones continuamente diferenciables) entonces la derivada f 0 (x) puede que no exista, pero podemos reemplazarla por el Jacobiano Generalizado de Clarke. Usando el concepto anterior mencionado de ∂f (x), extendemos el teorema de Hadamard a la clase de funciones localmente Lipschitz. 33 Inversión Local 3.1. 34 RESULTADOS PREVIOS El siguiente teorema es probado por Hadamard en [10]. En el enunciado de este teorema, se utiliza la siguiente notación //A//, donde A es una transformación lineal de Rn , en el sentido de la co-norma //A// = ı́nf kuk=1 |Au|. Con esta notación, podemos reformular la condición Integral de Hadamard como sigue: Teorema 3.2. Teorema de Hadamard Supongamos que f es una función de clase C 1 de Rn en Rn y supongamos que la derivada f 0 (x) es invertible para cada x. Sea m(t) = ı́nf |x|≤t //f 0 (x)//. Si Z ∞ m(t) dt = ∞ 0 entonces la función f es un difeomorfismo de Rn en Rn . Como resultado básico sobre inversión global, este teorema ha atraı́do una cierta atención. Variaciones y corolarios se han descubierto, se han encontrado diferentes pruebas, y extensiones a funciones C 1 en espacios de Banach se han estabilizado. Consultar en Gutú y Jaramillo [9], Hermann [13], John [16], Levy [18] y Meyer [19], entre otros. Ahora, cuando cada transformación A en ∂f (x) es invertible (para abreviar decimos que ∂f (x) es invertible) resulta que la función f es un homeomorfismo local en x. Si //∂f (x)// representa el número ı́nf A∈∂f (x) //A//, Pourciau prueba la siguiente generalización de el teorema de Hadamard Teorema 3.3. Supongamos que la función f es continua localmente Lipschitz de Rn en Rn , y además la derivada generalizada ∂f (x) es invertible para cada x. Sea m(t) = ı́nf |x|≤t //∂f (x)//. Si Z ∞ m(t) = ∞, 0 entonces la función f es un homeomorfismo de Rn en Rn . Inversión Local 3.2. INVERSIÓN LOCAL Ahora para el caso no-regular, obtenemos el siguiente Teorema de inversión local, recordemos que decir que ∂f (x) es invertible, significa que cada transformación lineal en ∂f (x) es invertible. Teorema 3.4. (Teorema de Inversión Local ) Si f es continua localmente Lipschitz y la derivada generalizada ∂f (x) es invertible, entonces la función f es un homeomorfismo de una vecindad de x en una vecindad de y = f (x). Ahora, consideremos un punto particular x y usando el teorema 3.5, obtenemos que la función f es un homeomorfismo de un entorno U de x en un entorno V de y = f (x). Ahora, si nos restringimos a U , entonces f tiene una función inversa continua g definida en V . Realmente lo que buscamos es establecer criterios que garanticen la existencia de un inversa global, y el interés está en si, y hasta dónde se puede extender esta inversa local más allá de su dominio original V . Muchos autores, ya sea directa o indirectamente, han estudiado este problema para homeomorfismo locales. por ejemplo ver Hermann [13] o John [16] entre otros. Por ejemplo, el enfoque que hace John es particularmente directo. Daremos una idea adaptada a nuestra situación. Supongamos que f : Rn → Rn es un homeomorfismo local, para simplificar un poco la notación, asumimos que f (0) = 0, entonces debe existir una bola BX al rededor de 0 y una inversa local g : BX → Rn con g(0) = 0. Definición 3.1. Denotemos por [w, y] el segmento de linea {(1 − t)w + ty : 0 ≤ t ≤ 1} para cada par de puntos w, y en Rn , y definimos el co-dominio D de f como: D es el conjunto de todos los puntos y en Rn tales que existe una función inversa continua g definida en el segmento [0, y] y satisfaciendo g(0) = 0. Cabe resaltar que el valor de g(y) depende únicamente de f e y. Ahora, definimos la función f −1 en D por f −1 (y) = g(y), y se obtienen los siguientes lemas. Lema 3.2.1. Lema de Continuidad D es un conjunto abierto, f −1 es una inversa de f definida en D, y f −1 es continua en D Demostración. Consideremos D = {y ∈ Rn / ∃ py : [0, 1] −→ Rn camino continuo tal que f ◦ py = qy } donde 35 Inversión Local 36 qy (t) = ty para 0 ≤ t ≤ 1. Sea y ∈ D, ahora como f es un homeomorfismo local e Im py , Im qy son compactas, podemos considerar un recubrimiento finito V1 ∪ V2 ∪ . . . ∪ Vm de Im qy y un recubrimiento finito U1 ∪ U2 ∪ . . . ∪ Um de Im py tal que Uk es una bola y f |Vk : Vk −→ Uk m S es un homeomorfismo, para k = 1 . . . m. Obsérvese que Im Py ⊂ Uk . Sea sk la inversa de k=1 f |Vk y sea ρ > 0 el número Lebesgue de [0, 1] para el cubrimiento finito {qy−1 (Vk ∩ Impq )}m k=1 . Sea 0 = t0 < t1 < . . . < tn = 1 una partición de [0,1] tal que tj − tj−1 < ρ. Ahora, para cada j = 1, . . . , n existe kj ∈ {1, . . . , m} tal que qy [tj−1 , tj ] ⊂ Vkj . Sea Ṽj = Vkj ∩ Vkj+1 . Podemos ver que qy (tj ) ∈ Ṽj , Ṽj es abierto, f |Vk es un homeomorfismo y f (Ṽj ) es abierto. Si tomamos z ∈ f (Ṽj ) existe un camino r : [tj , 1] −→ f (Ṽj ) uniendo py (tj ) y z. Sean q1 , q2 caminos continuos definidos ambos por qy sobre [0, tj ] y skj ◦ r y skj+1 ◦ r en [tj , 1] respectivamente. Entonces, como f es un homeomorfismo local, por la unicidad del levantamiento de caminos se tiene q1 ≡ q2 , en particular, skj (z) = skj+1 (z), en otras palabras skj ≡ skj+1 en f (Ṽj ). Por S lo tanto podemos definir una aplicación F sobre la unión σ = nj=1 f (Ṽj ) con skj en cada f (Ṽj ). Podemos ver que para z ∈ σ, f (F (z)) = z y para z ∈ Im py , F (z) = f −1 (z). Luego el conjunto σ es abierto y contiene el camino py . Además, F es continua en σ pues en un entorno de cualquier punto z ∈ σ, la aplicación F coincide con alguna de las skj , que son continuas. Lema 3.2.2. Lema de Maximalidad Supongamos que {yj } es una sucesión en D que se encuentra en un rayo fijado en 0 y converge / D. Entonces la sucesión {f −1 (yj )} es no-acotada. a algunos y ∈ Demostración. Sean y = 0 y la sucesión yn de la forma yn = tn ζ, donde ζ ∈ Rn , ζ ∈ / 0, tn ≥ 0, lı́mn→∞ tn = t existen y y = tζ. Supongamos que, para Yn = f −1 (yn ), lı́m Yn = Y ∈ Rn . Como f es continua en Y , tenemos f (Y ) = lı́m f (Yn ) = lı́m yn = y n→∞ n→∞ Ahora como {yn } ∈ D, existe una función inversa F de f definida en una ε- vecindad de el punto y para que F (y) = Y . Por la continuidad de F , tenemos lı́m F (yn ) = F (y) = Y n→∞ Lemas 37 Además como |yn − y| < ε para n suficientemente grande, podemos ver que f (F (yn )) = yn = f (Yn ). Como f es inyectiva cerca de Y tenemos que, para todo n suficientemente grande, F (yn ) = Yn = f −1 (Yn ) (3.1) Sea n uno de estos valores para los que se tiene (3.1). Entonces tenemos en F una inversa de f definida en el segmento [yn , y] y coincidiendo con f −1 en yn . Podrı́amos definir una inversa G de f en el segmento [0, y] y G = F en [yn , y]. Como G(0) = f −1 (0) = Y = 0, se sigue de la definición de D que y ∈ D. Luego contradice lo supuesto. 3.3. LEMAS Para la prueba del teorema sobre inversión global, debemos ser capaces de estimar el tamaño del co-dominio natural D. Para ello sera necesario de dos lemas que se establecen en esta sección. Pero antes procedemos a denotar ciertos aspectos que son necesarios para obtener estos lemas. Denotemos con I la transformación identidad en Rn , y sea A cualquier transformación lineal de Rn en Rn y definamos kAk = sup |Au|, //A// = ı́nf |Au|, |u|=1 |u|=1 la norma y co-norma de A, respectivamente. Si A y B son inversas, entonces tenemos que kBk = 1 //A// y kAk = 1 //B// Ahora bien, si A es una colección de transformaciones lineales de Rn en Rn , definimos kA k = sup kAk, A∈A //A // = ı́nf //A//, A∈A la norma y la co-norma de A , respectivamente. Decimos que A es invertible, si cada transformación lineal A en A es invertible, y en este caso A −1 representa la colección de todas las inversas A−1 para A ∈ A . Por ultimo, coA denota la envoltura convexa de la colección A . Lemas 38 Vamos a recordar que asumimos que f es una función localmente Lipschitz de Rn en sı́ mismo. Si f fuera C 1 en un entorno de un punto particular x, entonces por supuesto f tendrı́a una inversa local g y de clase C 1 definida en una vecindad de y = f (x). Esta inversa local g debe satisfacer g 0 (y) ◦ f 0 (x) = I y por tanto también kg 0 (y)k = 1 //∂f 0 (x)// (∗) Lo que se pretende es buscar un análogo de (∗) para el Jacobiano Generalizado de Clarke. Pero para esto requerimos primero el siguiente lema. Lema 3.3.1. (Lema de la co-norma) Sea A una colección de transformaciones lineales de Rn . Sı́ A es compacta e invertible, entonces 1 kcoA −1 k ≤ //A // Demostración. La colección coA −1 es compacta, porque A −1 es compacta y (en un espacio finito-dimensional) la envoltura convexa de un compacto es compacta. La función k · k, asumirá un valor máximo en coA −1 . Como coA −1 es un conjunto convexo de un espacio finito-dimensional, la función convexa kk asumirá su valor máximo en algún punto extremo B de coA −1 . Sabemos que B ∈ A −1 . Sea A la inversa de B. Entonces la desigualdad requerida se sigue fácilmente: kcoA −1 k = kBk 1 = //A// 1 ≤ //A // Para obtener un análogo de (∗), vamos a utilizar el lema anterior [3.3.1] y reemplazaremos A por el Jacobiano Generalizado de Clarke ∂f (x). Para hacer esto primero mostraremos una versión más detalla del Teorema de inversión local hecha por Pourciau. Teorema 3.5. (Teorema de Inversión Local ) Si f es localmente Lipschitz y la ∂f (x) es invertible, entonces la función f es un homeomorfismo de una vecindad U de x en una vecindad V de y = f (x) y tenemos que: Lemas 39 (a) La inversa local g definida en W = f (V ) con valores en V es Lipschitz. (b) Para casi todo z ∈ U , f y g son diferenciables en z y f (z) respectivamente, y además tenemos que g 0 [f (z)] ◦ f 0 (z) = I (∗∗) Demostración. La parte (a) es justamente el teorema de la función inversa (Teorema 2.2). Solo nos queda por mostrar la parte (b). Recordando del lema 2.1 que: µ[h(S)] = 0 se sigue siempre que S es un subconjunto µ-medible de Rn y que h es una función Lipschitz de un conjunto abierto conteniendo a S en Rn . Por el Teorema de Rademacher (1.3) existen Ωf y Ωg , y definimos T = (dom f 0 ) ∩ (dom g 0 ) como los dominios de f 0 y g 0 son µ- medibles; se tiene que V r T ⊂ (V r dom f 0 ) ∪ g(W r dom g 0 ); {z } {z } | | Ωf Ωg como µ(V r dom f 0 ) = 0 y µg(W r dom g 0 ) = 0 concluimos que µ(V r T ) = 0. Por lo tanto, siempre que z ∈ T tenemos g 0 [f (z)] ◦ f 0 (z) = 1 De (∗∗) queremos inferir la inclusión ∂g(y) ⊂ co ∂f (x)−1 , ya que con esto solo quedarı́a por aplicar el lema de la co-norma Lema 3.3.1 para obtener k∂g(y)k ≤ 1 . //∂f (x)// Inversión Global 40 Pero desafortunadamente no es ası́. Por lo tanto, sea V , g e y como las del teorema de inversión local Teorema 3.5. Asumamos que T ⊂ V y tomando T = (domg 0 ) ∩ f (domf 0 ) tenemos que T es medible y V r T tiene medida cero, si definimos el Jacobiano generalizado de Clarke de g en y con respecto a T , del Teorema 2.1 tenemos que ∂T g(y) = ∂g(y) ya que siempre podemos quitar conjuntos de medida cero, ahora como para cada w en T tenemos que f 0 [g(w)] ◦ g 0 (w) = I y usando el Teorema de inversion local Teorema 3.5 obtenemos que ∂T g(y) ⊂ co∂f (x)−1 . Luego por el lema de la co-norma Lema 3.3.1, obtenemos el siguiente lema k∂g(y)k = k∂T g(y)k 1 ≤ //∂f (x)// De acuerdo con esto obtenemos el siguiente lema Lema 3.3.2. Sea ∂f (x) invertible y supongamos que g es la función inversa local. Entonces k∂g(y)k ≤ 1 , //∂f (x)// cuando y = f (x). El segundo lema que necesitamos es una consecuencia de la Proposición 2.2. Luego tenemos el siguiente lema Lema 3.3.3. Si a y b pertenecen a un conjunto convexo C, tenemos |f (b) − f (a)| ≤ |b − a| sup k∂f (x)k. x∈C 3.4. INVERSIÓN GLOBAL Ahora con todas las herramientas expuestas en las anteriores secciones procedemos a mostrar la siguiente extensión del teorema de Hadamard. Teorema 3.6. Sean f : Rn → Rn una función localmente Lipschitz y supongamos que el Jacobiano generalizado de Clarke ∂f (x) es invertible para cada x. Sea m(t) = ı́nf |x|≤t //∂f (x)//. Si Z ∞ m(t) dt = ∞, 0 Inversión Global 41 entonces la función f es un homeomorfismo de Rn en Rn . Demostración. Utilizando el teorema de inversión local Teorema 3.5, tenemos que la función f es un homeomorfismo local. Sea D el co-dominio natural de f . Para mostrar este teorema es suficiente con mostrar que se cumple que D = Rn . Vamos a suponer que este no es el / D. Sea f −1 caso. Entonces la frontera de D contiene algún punto y. Como D es abierto, y ∈ la inversa definida en D, y para y ∈ [0, y) definimos n(y) = sup |f −1 (w)|. w∈[0,y] por el lema de maximalidad, como y → y en el segmento [0, y), f −1 debe ser no acotada. Inferimos que la función continua n : [0, y) → R asume todos los números no negativos. Por lo tanto para cualquier partición 0 = t0 < t1 < . . . < tJ < ∞ de [0, ∞), entonces existen puntos y0 , y1 , . . . , yJ en el segmento [0, y) tal que n(yi ) = tj e yj es el punto más cercano de 0 para lo que se tiene la siguiente igualdad. Haciendo la suma de Riemann J−1 X j=0 m(tj+1 )(tj+1 − tj ) = J−1 X m [n(yj+1 )] [n(yj+1 ) − n(yj )] . j=0 Ahora estimamos la diferencia que aparece en cada termino de la segunda suma y para y ∈ [0, y) y x = f −1 (y) tenemos por el lema 3.3.2, k∂f −1 (y)k ≤ 1 1 . //∂f (x)// m[n(y)] Pero aplicando ahora por el Lema 3.3.3 en el conjunto convexo [0, y), vemos que |f −1 (yj+1 ) − f −1 (yj )| ≤ |yj+1 − yj | m[n(yj+1 )] y esto implica que n(yj+1 ) − n(yj ) ≤ |yj+1 − yj | m[n(yj+1 )] Inversión Global 42 Ahora, volviendo a la suma de Riemann obtenemos J−1 X m(tj+1 )(tj+1 − tj ) = j=0 J−1 X m [n(yj+1 )] [n(yj+1 ) − n(yj )] j=0 ≤ J−1 X |yj+1 − yj | = |yJ | j=0 < |y| Por lo tanto esto contradice nuestra suposición que debe ser en realidad Rn R∞ 0 m(t) dt = ∞. De esto ne sigue que D Como corolario obtenemos el siguiente resultado Corolario 3.1. Supongamos que ∂f (x) es invertible para cada x. Si existe una constante C tal que //∂f (x)// ≥ C > 0 para cada x, entonces la función f es un homeomorfismo de Rn en Rn . Demostración. Como ∂f (x) es invertible en cada punto x, entonces existe un c > 0 tal que ı́nf k∂f (x)−1 k−1 ≥ c > 0, x∈X luego sup k∂f (x)−1 k < x∈X 1 < +∞, c por lo tanto Z 0 +∞ ı́nf k∂f (x)−1 k−1 dt = ∞ kxk=t Bibliografı́a [1] D. Azagra, J. Ferrera, F. López-Mesas, Approximate Rolle’s theorems for the proximal subgradient and the generalized gradient. J. Math. Anal. Appl. 283 (2003) 180-191. [2] J. M. Ball, Gloval invertibility of Sobolev functions and the interpenetration of matter. Proc. Royal Soc. Eddinburgh Sect. A88 (1981), 315 - 328. [3] F. H. Clarke, Y. S. Ledyaev, R. J. Stern, P. R. Wolenski, Nonsmooth Analysis and Control Theory. Springer-Verlag, GTM. 178 (1998) 69-136. [4] F. H. Clarke, Optimization and Nonsmooth Analysis Society for Industrial and Applied Mathematics (SIAM). 1990 25-75 [5] F. H. Clarke, Generalized Gradients and Applications. Transactions of the american Matematical Society. Vol.205, (1975), 247 - 263. [6] F. H. Clarke, On the Inverse Function theorem. Pacific Journal of mathematics. Vol.64, No 1, 1976. [7] M. Fabian and D. Preiss, On the Clarke’s generalized jacobian. Rend. Circ. Mat. Palermo (2) Suppl. 14 (1987), 305-307. [8] D. Gale y H. Nikaido, The Jacobian matrix and Global univalence of mappings. Math. Ann. 159 (1965), 81 - 93. [9] O. Gutú, J. A. Jaramillo, Global homeomorphisms and covering projections on metric spaces. Math. Ann. 338 (2007) 75-95. [10] J. Hadamard, Sur les transformations ponctuelles. Bull. Soc. Math. France. 34 (1906), 71 - 84. 43 Bibliografı́a [11] H. Halkin, Interior mapping theorem with set-valued derivatives. J. Analyse Math. 30 (1976), 200 - 207. [12] H. Halkin, Mathematical programming without differentiability, in “Calculus of Variations and COntrol Theory”. D. Rusell, Ed., Academic Press, New York (1976). [13] R. Hermann, Differential Geometry and the Calculus of Variations. Math. in Sci. and Eng. Vol 49, Academic Press, New York, (1968). [14] J.-B. Hiriart-Urruty, On necesary optimality conditions in nondifferentiable programming. Math. Programming. 14, No 1 (1978), 73 - 86. [15] J.-B. Hiriart-Urruty, Mean valued theorems in nonsmooth analysis. Numer. Funct. Anal. Optim. 2, (1980), 1 - 30. [16] F. Jhon, On quasi-isometric mapping, I. Comm. Pure Appl. Math. 21 (1968), 77 - 110. [17] Y. Kawamura, Invertibility of Lipschitz continuous mappings and applications to electrical network equations. SIAM J. Math. Anal. 10 No.2 (1979), 235 - 265. [18] P. Levy, Sur les fonctions des lignes implicités. Bull. Soc. Math France. 48 (1920), 13 - 27. [19] G. Meyer, On solving nonlinear equations with a one parameter imbedding. SIAM J. Numer. Anal. 5 (1968), 739 - 752. [20] B. H. Pourciau, Analysis and optimization of Lipschitz continuous mappings, J. Optim. Theory. Appl. 22, No. 3 (1977) 311-351. [21] B. H. Pourciau, Hadamard’s Theorem for Locally Lipschitzian Maps. J. Math.Anal. Appl. 85 (1982) 279-285. [22] B. H. Pourciau, Global properties Lipschitzian maps. SIAM J. Math. Anal. 14 (1983) 796-799. [23] B. H. Pourciau, Global Invertibility of Nonsmooth Mappings. J. Math.Anal. Appl. 131 (1988) 170-179. [24] M. Radulescu y S. Radulescu, Global inversion theorems and applications to differential equations. Nonlinear Anal. 4 (1980), 951 - 965. 44 Bibliografı́a [25] Robert R. Phelps, Convex functions, monotone operators and differentiability, Lecture Notes in Mathematics, Springer-Verlag. 1364 (1993) 10-11. 45