Estabilidad de los indicadores topológicos de pobreza ESTABILIDAD DE LOS INDICADORES TOPOLÓGICOS DE POBREZA Fedriani Martel, Eugenio M. Martín Caraballo, Ana M. Mínguez Lopera, M. Noemí Universidad Pablo de Olavide (Sevilla) RESUMEN La estabilidad de los indicadores topológicos de pobreza es estudiada en este trabajo desde dos puntos de vista diferentes: desde la óptica matemática de funciones reales estables y desde la óptica estadística de variables aleatorias estables. Se consideran recientes familias de indicadores de pobreza definidos en base a la teoría matemática de grafos, denominados indicadores topológicos. Tanto en el caso del Indicador Topológico de Intensidad de la Pobreza como en el del Indicador Topológico de Desigualdad, se demuestra que no son variables aleatorias estables en el sentido estricto del término. Sin embargo, se demuestra que el Indicador Topológico de Intensidad de la Pobreza siempre es una función real estable, mientras que el Indicador Topológico de Desigualdad lo será solo bajo determinadas circunstancias. Palabras clave: Indicadores de pobreza, indicadores multidimensionales de pobreza, indicadores topológicos de pobreza, estabilidad, variables aleatorias estables. XIII Jornadas de ASEPUMA 1 Fedriani Martel, E.M; Martín Caraballo, A.M; Mínguez Lopera, M.N. 1. INTRODUCCIÓN El concepto de pobreza, su naturaleza y cuantificación, ha sido desarrollado por numerosos investigadores en los últimos años. Al igual que ocurre con conceptos como la calidad o condiciones de vida, el concepto de pobreza es tan subjetivo que aún no se ha llegado a una definición universal del mismo. El Informe sobre Desarrollo Humano 2000 [5] cita: “la pobreza es más amplia que la falta de ingresos [. . .] es una privación en muchas dimensiones. Si el ingreso no es la suma total de la vida humana, la falta de ingreso no puede ser la suma total de la privación humana”. Por ello, se intenta cuantificar la pobreza desde un punto de vista multidimensional y no solo medirla con la mera observación de la renta de las unidades de ésta. La pobreza es un círculo vicioso que engloba el hambre, la enfermedad, la falta de atención sanitaria, una alta tasa de mortalidad entre la gente joven, una esperanza de vida muy baja, la falta de cultura, etc. Además, la misma variable medida en poblaciones diferentes o circunstancias diferentes produce distintas interpretaciones sobre pobreza. Teniendo en cuenta ambos aspectos, multidimensionalidad y heterogeneidad geográfica, Martín (2004) [4] define dos nuevas familias de indicadores de pobreza, denominados indicadores topológicos. Surgen como alternativa a los indicadores tradicionales de pobreza que no tienen en cuenta la multidimensionalidad. Sin embargo, aunque estos nuevos indicadores fueron probados con datos reales y sus resultados fueron aceptados, aún no se ha llegado a comprobar su estabilidad, lo que consolidaría la fiabilidad de los mismos en la medición de la pobreza. En este trabajo se comprueba la estabilidad de los indicadores topológicos desde dos puntos de vista diferentes: desde la óptica matemática de funciones reales estables y desde la estadística de variables aleatorias estables. 2 XIII Jornadas de ASEPUMA Estabilidad de los indicadores topológicos de pobreza 2. PRELIMINARES A continuación se realiza una breve presentación de las dos nuevas familias de indicadores topológicos de pobreza definidos por Martín [4]. Dado que solo se enumeran los resultados a los que se hace referencia en epígrafes sucesivos, para acceder a una exposición más detalla de los mismos puede acudirse a la obra referida. 2.1. El Indicador Topológico de Intensidad de la Pobreza El Indicador Topológico de Intensidad de la Pobreza, denotado como C * , proporciona una ordenación jerárquica sobre un conjunto de unidades de análisis que forman parte de un conjunto global, en función del nivel de desarrollo o intensidad de pobreza. Entiéndase por conjunto global aquella unidad mayor que está formada exclusivamente por todas las unidades a estudiar. Para su cálculo se necesita construir un grafo bipartito donde el primer subconjunto de nodos (V1 ) es una división exhaustiva y excluyente de las unidades en análisis y el segundo (V2 ) las variables que se utilizan para medir la intensidad de la pobreza en la población objeto de estudio. En lo sucesivo, a cada uno de los nodos de V1 se denominará nodo unidad y nodo característica si es de V2. Se dibuja una arista no dirigida desde un nodo unidad a un nodo característica si el valor de la variable observada en dicha unidad muestra una intensidad de pobreza mayor al soportado por el conjunto global sobre esa misma característica. Definición 2.1.1.- El Indicador Topológico de Intensidad de la Pobreza es el cociente entre el tamaño del grafo (número total de aristas dibujadas) y el cardinal de V1. Se obtienen tantos Indicadores Parciales de Intensidad de la Pobreza ( C i* ) como características sean analizadas en la población, siendo su expresión formal la siguiente: C i* = d (u i ) , # V1 donde d (u i ) es la valencia del nodo i, es decir, el número de aristas que llegan a este nodo. Con esto se demuestra fácilmente que una descomposición de C * resulta ser: C* = ∑ C i* . i∈V2 XIII Jornadas de ASEPUMA 3 Fedriani Martel, E.M; Martín Caraballo, A.M; Mínguez Lopera, M.N. 2.2. El Indicador Topológico de Desigualdad Dado un conjunto global de unidades de análisis, el Indicador Topológico de Desigualdad mide la desigualdad existente, referida al nivel de pobreza soportado, entre unidades de este conjunto total. Para su construcción, se dibuja un grafo dirigido mediante el cual se obtiene una ordenación jerárquica de clases dentro del conjunto, agrupando en un mismo nivel aquellas unidades para las que el nivel de pobreza se considera no significativamente diferente. Los nodos de este grafo dirigido son las unidades a comparar. Para cada característica contemplada, se dibujará una arista dirigida desde una unidad ( u i ) a otra ( u j ) si el valor observado en dicha característica en la unidad u i denota un valor mayor al soportado por u j en esa misma característica, variando r en el conjunto índice de las características contempladas. Definición 2.2.1.- Se define el Indicador Topológico de Desigualdad (TC ) como el cociente entre el número de ciclos y el tamaño del digrafo. 3. FUNCIONES REALES ESTABLES Por similitud con lo que ocurre con los procesos numéricos, una función real se dice estable cuando un pequeño error en el valor de la variable independiente no se propaga o amplía al considerar el resultado de aplicar la función, sino que tiende a amortiguarse. Cuando se trabaja con funciones cuyo dominio posee puntos de acumulación, el concepto de estabilidad es más débil que el de continuidad uniforme o, incluso, que el de continuidad (por tal motivo, la estabilidad está garantizada en las funciones reales continuas). 3.1. Estabilidad de la función Indicador Topológico de Intensidad de la Pobreza Las modificaciones que pueden afectar a los datos de partida pueden producir diversos cambios sobre el grafo bipartito dibujado a partir de los datos originales; puede aumentar o disminuir el número de aristas dibujadas y consiguientemente el valor final de Indicador Topológico de Intensidad de la Pobreza. Por tanto, debe comprobarse cuál es el alcance de estas variaciones tras pequeñas modificaciones, con el fin de argumentar conclusiones sobre la estabilidad de este indicador. 4 XIII Jornadas de ASEPUMA Estabilidad de los indicadores topológicos de pobreza Sea G = (V , X ) el grafo bipartito de un análisis de pobreza. En general ocurre que si k i ∈ ℜ es la variación, positiva (creciente) o negativa (decreciente), en tantos por uno sufrida en la valencia del nodo representante de la característica i-ésima, el nuevo valor para el Indicador Topológico Parcial de Intensidad de la Pobreza es C i*' = (1 + k i ) ⋅ C i* . Teniendo en cuenta esta relación y la descomposición del Indicador Topológico de Intensidad de la Pobreza como la suma de todos los Indicadores Topológicos parciales de Intensidad de la pobreza, se demuestra el siguiente resultado: Proposición 3.1.1.- Si wi es el peso del total de las aristas incidentes en el nodo representante de la característica i -ésima con respecto al tamaño del grafo (calculado sobre el grafo anterior a las variaciones) y k i representa la variación sufrida por el número de aristas incidentes en el nodo característica i-ésima, entonces: C *' = C * ⋅ (1 + ∑ k i ⋅ wi ) . i∈V2 Demostración. Tenemos que: C *' = ∑ (1 + k i ) ⋅ C i* = ∑ C i* + ∑ k i ⋅ C i* = C * + ∑ k i ⋅ C i* . i∈V2 i∈V2 i∈V2 i∈V2 Multiplicando y dividiendo el segundo sumando por wi = d (u i ) , donde #X es el #X número total de aristas, la igualdad no varía: C *' = C * + ∑ k i ⋅ . i∈V2 wi ⋅ C i* wi (1) Ahora bien, C i* d (u i ) # X #X = ⋅ = = C* . # V1 d (u i ) # V1 wi Sustituyendo en (1), tenemos que: C *' = C * + ∑ k i ⋅ wi ⋅ C * = C * ⋅ (1 + ∑ k i ⋅ wi ) i∈V2 ڤ i∈V2 Corolario 3.1.2.- C * es continuo en k i y wi . Demostración. La variación en C * es C *' − C * = C * ∑ k i ⋅ wi . ڤ i∈V2 Así, considerando C * una función real en las variables k i y wi , pequeñas variaciones en los datos suponen también pequeñas variaciones en los resultados. Por tanto, el Indicador Topológico de Intensidad de la Pobreza es una función estable. XIII Jornadas de ASEPUMA 5 Fedriani Martel, E.M; Martín Caraballo, A.M; Mínguez Lopera, M.N. 3.2. Estabilidad de la función Indicador Topológico de Desigualdad Las posibles modificaciones que pudieran surgir en los datos del conjunto de unidades objeto de estudio en un análisis de la desigualdad se mostrarían en un incremento o decremento sobre los valores observados en algunas características de algunas unidades (o en todas). Observando los diferentes efectos de estas modificaciones, nos encontramos ante las siguientes situaciones: 1. Aumentan o disminuyen en la misma proporción todos los valores de una variable. En este caso, el valor de TC no varía debido a que la relación de orden utilizada (menor que) es estable por traslaciones. En consecuencia, el Indicador Topológico de Desigualdad es invariante ante cambios de medida en una o más características del estudio. 2. La modificación se produce solo sobre determinados valores de las variables. Tras estas modificaciones puede ocurrir: (a) El número de aristas no se ve incrementado y, por tanto, tampoco el número de ciclos del grafo; aquí, TC no varía. (b) Los cambios producen nuevas aristas o eliminan algunas, generando o eliminando nuevos ciclos, por lo que TC puede variar. Evidentemente, solo pueden causar problemas de estabilidad aquellos cambios selectivos sobre algunos valores de las variables de manera que el número de ciclos o el tamaño del digrafo varíen. Sean k c y k t ∈ Z , las diferencias entre nuevos y antiguos números de ciclos y de aristas, respectivamente. El nuevo valor para el Indicador Topológico de Desigualdad sería: TC ' = Núm. de ciclos + k c , Tamaño + k t estando referidos tanto el número de ciclos como el tamaño al digrafo original (previo a los cambios). Proposición 3.2.1.- Sean D = (V , X ) el digrafo que representa las desigualdades entre varias zonas de un conjunto y D ' = (V ' , X ' ) el que se obtiene de D tras incluir k c nuevos ciclos y k t aristas en D, con k c y k t ∈ Z . Entonces: TC ' − TC = 6 k c − TC ⋅ k t # X + kt (2) XIII Jornadas de ASEPUMA Estabilidad de los indicadores topológicos de pobreza Demostración. Sea ρ el número de ciclos de D. TC ' − TC = ρ + kc # X + kt − ρ #X = ( ρ + k c )⋅# X − ρ (# X + k t ) # X ⋅ k c − ρ ⋅ k t = ; (# X + k t )⋅# X (# X + k t )·# X dividiendo numerador y denominador por el tamaño original del dígrafo, tenemos que: TC ' − TC = k c − TC ⋅ k t # X + kt ڤ Dado un digrafo cualquiera, la variación entre TC ' y TC depende de k c y k t . Una nueva arista en el digrafo ( k t = 1) puede dar lugar a un aumento considerable de ciclos. Así pues, dado que k c se encuentra en el numerador de (2), ante un mismo incremento sobre el tamaño del dígrafo, esta diferencia puede aumentar sustancialmente, por lo que no se tiene segura la estabilidad de la función Indicador Topológico de Desigualdad cualesquiera que sean k c y k t . 4. VARIABLES ALEATORIAS ESTABLES Sería Paul Lévy en 1925 quien desarrollara la Teoría General de las Distribuciones Estables [2], determinando las condiciones necesarias para que una familia de distribuciones fuera estable. Por esto, estas distribuciones son a menudo llamadas distribuciones estables de Lévy. Definición 4.0.1.- Una variable aleatoria X se dice que es estable, o que tiene una distribución F estable si, para todo entero positivo n, existen constantes a n > 0 y bn ∈ ℜ de forma que dadas n variables aleatorias independientes e idénticamente distribuidas a X, X 1 , X 2 ,..., X n , se tiene que: n S n = ∑ X i ≈ Fan X +bn . i =1 Además, X tendrá una distribución estable en sentido estricto si bn = 0 . Así, X es estable si la suma de n variables aleatorias independientes e idénticamente distribuidas a ella tienen la misma distribución que X, salvo por los parámetros de escala ( a n ) y localización ( bn ). Para un análisis más exhaustivo de las variables aleatorias estables se pueden consultar [1], [2] y [3], por ejemplo. Se apunta a continuación un teorema enunciado por Feller [1]: XIII Jornadas de ASEPUMA 7 Fedriani Martel, E.M; Martín Caraballo, A.M; Mínguez Lopera, M.N. Teorema 4.0.2.- Toda distribución estable es continua. ڤ Luego un primer paso que resulta lógico dar es estudiar si las variables Indicador Topológico de Intensidad de la Pobreza e Indicador Topológico de Desigualdad son variables aleatorias discretas o continuas. Según se vio antes, el Indicador Topológico de Intensidad de la Pobreza es definido como el cociente entre el número de aristas dibujadas en el grafo bipartito y el cardinal del subconjunto de nodos V1 . El número de aristas que se pueden dibujar en un grafo bipartito es una variable aleatoria discreta que toma valores en el conjunto U = {0,1,2,..., n} , siendo n el máximo número de aristas que puede dibujarse en un grafo con r nodos en V1 y s nodos en V2 , luego n = r ⋅ s . Por tanto, el Indicador Topológico de Intensidad de la Pobreza en un análisis con r unidades y s características 1 2 r ⋅ s −1 es una variable aleatoria discreta que toma valores en W = {0, , ,..., , s} . r r r El Indicador Topológico de Desigualdad, definido como el cociente entre el número de ciclos formados en el digrafo y el tamaño del propio digrafo, toma valores con probabilidad positiva en un conjunto finito de valores. Por tanto, fijados los objetos de estudio, el indicador TC es también una variable aleatoria discreta [1]. Teniendo en cuenta el Teorema 4.0.1, ninguna de las dos variables aleatorias puede ser estable, dado que no son continuas. Sin embargo, tal vez esto no sea un problema importante, pues algunas distribuciones discretas pueden ser aproximadas a una distribución Normal, que es una distribución estable y que además, según el Teorema Central del Límite, es la única variable estable con varianza finita. 4.1. Aproximación de C * a una ley Normal Para comprobar si el Indicador Topológico de Intensidad de la Pobreza puede ser aproximado a una ley Normal, dado un número suficientemente grande de mediciones sobre este indicador, se procedió a calcular 51 valores del Indicador Topológico de Intensidad de la Pobreza. Estos forman parte de un estudio sobre la intensidad de la pobreza en las comunidades autónomas españolas1 para los años 2000, 2001 y 2002, en base a la proporción de población parada sobre el total de la población activa en el 1 8 Se excluyeron del estudio las ciudades autónomas de Ceuta y Melilla. XIII Jornadas de ASEPUMA Estabilidad de los indicadores topológicos de pobreza último cuatrimestre del año de referencia, la tasa de analfabetismo en la población mayor de 16 años y el Producto Interior Bruto generado en dicho año.2 Con la ayuda del programa informático SPSS3, se realizó el siguiente contraste de hipótesis: H 0 : C * ≡ Normal H 1 : C * ≡ no Normal (3) Observando el p-valor obtenido en el contraste de normalidad de KolmogorovSmirnov (tamaño muestral mayor que 50), p < 0.0005 , incluso para un nivel de significación del 0.01% (nivel de confianza del 99%) se rechaza a hipótesis nula planteada en (3). 4.2. Aproximación de TC a una ley Normal Análogamente al caso anterior, se propone el siguiente contraste de hipótesis: H 0 : TC ≡ Normal H 1 : TC ≡ no Normal (4) Para obtener un número suficientemente grande de valores del Indicador Topológico de Desigualdad, se analizó la desigualdad entre los países asiáticos de China, Japón y República de Corea para los años 1990, 1991, 1995, 1998, 1999, 2000, 2001 y 2002, con la observación de las siguientes características:4 • Fuerza laboral infantil. Porcentaje sobre el total de la fuerza laboral de niños trabajadores de edades comprendidas entre los 10 y 14 años. • Ratio de mortalidad infantil. Porcentaje de niños muertos antes de cumplir un año de edad exacta por cada 1.000 nacidos vivos. • Fuerza eléctrica consumida. Mide la producción de potencia de plantas, sin las pérdidas de distribución. 2 Fuente de información INEBASE. 3 SPSS 12.0. Copyright 2004, SPSS Inc. 4 Fuente de información World Bank Group (2004) [6]. XIII Jornadas de ASEPUMA 9 Fedriani Martel, E.M; Martín Caraballo, A.M; Mínguez Lopera, M.N. • Inmunización. Porcentaje de niños que recibieron una dosis de vacuna antes del primer año de edad sobre el total de niños de entre 12 y 23 meses de edad cumplida. • Esperanza de vida al nacer. • Ordenadores personales por cada 1.000 habitantes. • Matriculados superiores. Porcentaje de personas matriculadas en un tercer nivel sobre el total de la población de riesgo. Son estudios de tercer nivel aquellos que requieren haber terminado un primer y segundo nivel y pasar satisfactoriamente un examen de evaluación. Restringiendo la combinación de pares de variables a aquellos pares en los que las variables no tengan una correlación lineal fuerte, y dado la posibilidad de datos disponibles, se calculan un total de 49 valores del Indicador Topológico de Desigualdad. Estos 49 valores se analizaron con el programa informático SPSS, aplicándoseles un contraste de normalidad de Shapiro-Wilk (tamaño muestral menor que 50) resultando un p-valor menor que 0.0005, con lo que con un 99% de nivel de confianza puede afirmarse que no sería acertada una aproximación a la ley Normal para el Indicador Topológico de Desigualdad. 5. CONCLUSIONES Vistas las actuaciones y resultados alcanzados en epígrafes anteriores, puede afirmarse que el Indicador Topológico de Intensidad de la Pobreza es un indicador suficientemente estable, al menos matemáticamente hablando, pues se comporta como una función estable. Para el caso de la medición de la intensidad de la pobreza mediante el indicador formulado por Martín [4], se ha demostrado que es continuo para todo valor k i y wi (la variación sufrida por el número de aristas incidentes en el nodo característica i-ésima y el peso del total de aristas incidentes en este nodo con respecto al tamaño del grafo, calculados sobre el grafo anterior a las variaciones, respectivamente). Por el contrario, se tiene que el Indicador Topológico de Desigualdad no es una función estable en todo momento, dado que pequeñas modificaciones selectivas sobre 10 XIII Jornadas de ASEPUMA Estabilidad de los indicadores topológicos de pobreza los datos de origen pueden dar lugar a una variación considerable sobre el valor final de este indicador y, por tanto, sobre las conclusiones alcanzadas. En cuanto a lo que respecta a la visión de estos indicadores como variables aleatorias de un espacio muestral específico, se comprueba en este artículo que ambas variables aleatorias poseen una distribución que no es estable en el sentido estricto de la definición dado por Lévy [2], dado que ambas variables son discretas. 6. REFERENCIAS BIBLIOGRÁFICAS • [1] FELLER, W. (1971). “An Introduction to Probability Theory and Its Applications”. Vol. 2, 2ª ed., Wiley Series in Probability and Mathematical Statistic. • [2] LEVY, P. (1925). “Calcul des Probabilités”. Gauthier-villars. • [3] LEVY, P. (1937). “Théorie de l’Addition des Variables Aléatoires”. Gauthiervillars. • [4] MARTÍN, A. M. (2005). “Valoración de la pobreza mediante técnicas de agregación de datos de diferentes naturaleza”. Tesis doctoral. Departamento de Economía y empresa. Universidad Pablo de Olavide de Sevilla. • [5] PROGRAMA DE DESARROLLO DE LAS NACIONES UNIDAS (2000). “Informe sobre Desarrollo Humano 2000”. Oxford University Press. • [6] WORLD BANK GROUP. (2004). “2004|World Development Indicators”. XIII Jornadas de ASEPUMA 11