¿CÓMO JERARQUIZAR DATOS DE DISTINTA NATURALEZA? Pedro Álvarez Martínez Mª del Mar Guerrero Manzano Facultad de CC. Económicas y Empresariales Universidad de Extremadura Avda. de Elvas s/n 06071 Badajoz Tfno. & Fax: 924 28 95 56 E-mail: palvarez@unex.es, marguerm@unex.es RESUMEN: La diversidad de análisis en los que se ha utilizado la medida de Rasch, ha motivado una nueva línea conceptual que amplía el campo de aplicación a los problemas relacionados con el establecimiento de un orden jerárquico. ¿Es posible establecer un orden jerárquico cuando los datos describen diferentes situaciones con características de distinta naturaleza y estén expresados en unidades de medida de distinta índole? El presente trabajo, desarrolla una metodología transformando los datos en otros que reflejan situaciones análogas a las iniciales, de forma que nos permita compararlos utilizando un referente común a las circunstancias que las caracterizan, mediante el Modelo de Rasch como instrumento de medida. 1. INTRODUCCIÓN Nuestro objetivo es establecer un orden jerárquico sobre distintas situaciones en base a varios criterios. Supongamos por ejemplo, que queremos jerarquizar distintas empresas, atendiendo a los siguientes criterios: cifra de ventas, número de empleados, ámbito de actuación, niveles de productividad, etc.... Entonces obtenemos un ranking de las empresas con arreglo a su cifra de ventas, otro conforme al número de empleados, y así sucesivamente. Se tendría una ordenación por cada criterio escogido, pero ¿cómo sintetizar esas ordenaciones individuales en una global, que permita jerarquizar todas las empresas ? Para sintetizar los distintos criterios en uno sólo, es necesario que todos los datos tengan un referente común, y así, la jerarquización global se realizaría en términos de este referente común. Sean por ejemplo, las delegaciones de la Agencia Estatal de la Administración Tributaria, de la que conocemos sus recaudaciones por el Impuesto sobre la Renta de las Personas Físicas, a lo largo de un período de años. Todas estas recaudaciones tienen en común que proceden de las rentas percibidas por los ciudadanos, a los que se le aplica por igual la legislación fiscal, aunque las cantidades 1 percibidas sean distintas. Es decir, un referente común, por ejemplo, sería fidelidad a la normativa (Guerrero, 2001). En principio, este referente común es susceptible de ser evaluado, para su posterior jeraraquización. Una forma de hacerlo es a través de la suma de todos los criterios individuales, disponiendo los datos en forma de matriz, donde cada columna exprese los distintos criterios con los que se va a jerarquizar. Si los distintos criterios están recogidos en las distintas columnas de la matriz, el total de la suma de cada columna, sería una primera aproximación para la jerarquización. Ahora bien, si los datos describen situaciones con características de distinta naturaleza, el llevar a cabo su suma es inviable, al estar expresados en distinta unidad de medida (por ejemplo, cifras de ventas, número de empleados, etc). No se pueden sumar cantidades heterogéneas. Se requiere pues, un diseño donde se fundamente la jerarquización buscada, para lo cual es necesario una transformación de los datos heterogéneos en otros homogéneos, donde la suma tenga sentido en términos del referente común. Se requiere entonces despojar los datos de su especificidad, sin que se pierda la información que refleja la intensidad de cada magnitud. Una forma de hacerlo es transformando los datos correspondientes en categorías. Observamos que en todas y cada una de las columnas se alcanza un valor máximo y un valor mínimo, y entre estos extremos consideramos el mismo número de valores intermedios (Álvarez 2000). Asignamos a la mayor cantidad de cada columna, el mayor valor de una escala, y a la menor cantidad, el menor valor de la escala. El resto de los valores intermedios, los obtenemos por un proceso de interpolación logarítmica. Este proceso se repite para cada una de las columnas. De esta forma nuestra matriz de datos se ha transformado en una nueva matriz, dónde las cifras originales se han sustituido por niveles o categorías. Así, un nivel 5 en una determinada columna, coincide con un nivel 5 de otra, aunque las cantidades de las que procedan estuvieran expresadas en distintas unidades. De igual manera, un nivel 9 en una columna implica una mayor presencia en el referente común, que un nivel 3 de otra, aunque la cantidad de la que proceda el 9 sea menor que de la que proceda el 3. Ahora, la suma de niveles sí tiene sentido: una mayor suma supone categorías más altas que otra de menor suma. 2. REFERENTE COMÚN Un referente común en un conjunto de datos de diferente naturaleza, nos permite comparar de forma global situaciones distintas que simultáneamente recogen criterios distintos. La formulación de Rasch, basándose en la suma, logra comparar estas situaciones. Pero para obtener una suma que tenga sentido, hay que proceder a una previa categorización. Sean por ejemplo, tres países1, de los que conocemos su Producto Interior Bruto, su Esperanza de vida al nacer y su Tasa de alfabetismo adulto. Si nos planteamos establecer un orden jerárquico de estos tres países, conforme a estos tres criterios, en principio lo único que podemos hacer es efectuar una evaluación por cada criterio, y conoceríamos así el país con mayor Producto Interior Bruto, con mayor Esperanza de 2 vida al nacer, y con mayor Tasa de alfabetismo adulto. Es decir, tendríamos tres jerarquizaciones distintas: Cuadro 1: Jerarquizaciones según cada criterio Criterio 2: Criterio 1: Producto Esperanza de vida al Interior Bruto nacer Criterio 3: Tasa de alfabetismo adulto País 1 País 3 País 2 País 2 País 1 País 3 País 3 País 2 País 1 ¿Cómo se pueden globalizar estas tres ordenaciones en una, a partir de la cual se pueda obtener una jerarquización de los países con arreglo al Producto Interior Bruto, a la Esperanza de vida y a la Tasa de alfabetismo?. Lo primero que se necesita es definir un referente común que globalice y de sentido a los tres anteriores. Un aspecto que se refleja en todos y cada uno de ellos podría ser por ejemplo, el desarrollo. Se podría hablar así del país con mayor o menor desarrollo: Cuadro 2: Jerarquización según un único criterio Criterio: Desarrollo País 1 País 2 País 3 Para sintetizar todos los criterios anteriores en un único criterio, que permita comparar los países según su desarrollo, es necesario encontrar una cifra representativa. Se podría pensar en la suma de los tres criterios anteriores, pero surge el problema de que las unidades de medida utilizadas para cada uno de ellos es diferente: el Producto Interior Bruto está expresado en unidades monetarias, por ejemplo, dólares, la Esperanza de vida al nacer, en años, y la Tasa de alfabetismo, en porcentaje. Sumar estas tres cantidades para cada país no tiene ningún sentido, al tratarse de datos heterogéneos, no expresados en la misma unidad. Una forma de hacer viable la suma es mediante una transformación de los datos en niveles de una escala común. Asumiendo que los tres criterios son igual de relevantes para la concepción del desarrollo, un procedimiento sería el que a continuación se detalla (Álvarez, 2000). Sea por ejemplo la escala elegida del 1 al 5. Si por cada criterio, hay un valor máximo y un valor mínimo para todos los países, vamos a equiparar el mayor nivel de la escala, el 5, con la cifra máxima en uno de los criterios, y el 1, con la 3 mínima. El resto de los valores intermedios, se obtienen por un proceso de interpolación logarítmica (Álvarez, Morán & Wright, 1993): De esta forma, se pueden sumar las cifras categorizadas de cada país, al tratarse de datos ya homogéneos. Se ha dado sentido a la suma, al obtenerse a partir de datos originales, una cifra total que nos sirve de base para la jerarquzación. La técnica desarrollada en el Modelo de Rasch, nos permite la jerarquización de situaciones distintas, utilizando la suma, a partir de la obtención de una medida el referente común definido en los datos analizados. Conocida la suma, el referente común, desarrollo en nuestro ejemplo, se puede concebir como una línea recta, (Álvarez & Pulgarín, 1996a, 1996b, 1997a, 1998a, 1999), a lo largo de la cual se ubican los países βn, (n = 1,2,3), y los distintos criterios δi, (i =1,2,3), según su medida. Se supone que hay una única dirección, lo cual implica “más” de la variable. “Más” es más distancia a lo largo de la línea. Así se puede hablar del país con mayor o menor desarrollo, según su respectiva posición en la línea que la representa, y del criterio (Producto Interior Bruto, Esperanza de vida o Tasa de alfabetismo) más relevante en tal desarrollo. La siguiente representación muestra una forma en la que las ubicaciones de los βn y los δi, a lo largo de la línea se puede concebir (Wright & Stone, 1979). β1 β2 β3 β4 _______|________________|_________________|_________________|_______ | | | 0 δ1 δ2 δ3 +∞ Menor desarrollo Mayor desarrollo Supongamos un nivel h en el desarrollo representado por la línea. El país β1 no supera ninguno de los niveles fijados en los criterios δ1, δ2 y δ3, por lo que se sitúa a la izquierda de todos ellos. El país β2 supera el de δ1, y se sitúa a su derecha, pero no así los de δ2 y δ3, por lo que está a la izquierda de estos. El país β3, sobrepasa a δ1 y δ2, se coloca a su derecha, al superar los niveles que representan, pero no así a δ3, situándose por lo tanto a su izquierda. Por último, el país β4, supera todos los niveles en los criterios δ1, δ2 y δ3, colocándose a la derecha de todos ellos. Se puede entonces afirmar que β1 es el país con menor medida de desarrollo de todos, está situado más a izquierda del continuo que representa el referente común, mientras que β4, será el de mayor medida, por estar situado más a la derecha. El mismo razonamiento se puede aplicar a los criterios δi, pudiendo señalarse que el δi con la medida más pequeña, se corresponde con el de mayor frecuencia en los países, (en la representación anterior sería δ1). Siguiendo un orden creciente, el criterio que represente el δi con mayor medida, es el de menor frecuencia en las observaciones, (sería el caso de δ3). Luego, si se alcanza un determinado nivel en un país βn, en el criterio δi, entonces, βn es mayor que δi, y si un determinado nivel en δi no ha sido alcanzado por 4 un país βn, entonces, βn es menor que δi. Así, los ítems δi clasifican a los parámetros βn y viceversa (Wright & Stone, 1979). Si lo mismo que se ha hecho para un nivel h de desarrollo, se realiza para todos los niveles definidos, se puede sintetizar, a través de la probabilidad de Rasch, para cada país, βn, y criterio, δi, respectivamente, una medida del referente común, a partir de la suma, ubicando los países y criterios a lo largo de la línea que representa el desarrollo Dicha medida es el criterio único que necesitábamos para proceder a la ordenación jerárquica de los países, en nuestro ejemplo, respecto a los tres criterios considerados. La metodología seguida, está plenamente reconocida y avalada en distintos campos, donde se ha aplicado, tales como el desarrollo, la contaminación, la medicina en multitud de vertientes, la bibliometría, informetría, eonometría, quimiometría..., (Álvarez & Blanco, 2000; Álvarez & Galera, 2000; Álvarez & Morán, 2001; Álvarez, Ortiz, & Ruiz, 2001; Álvarez, Pulgarín & Escalona, 2000, entre otros), cada uno con su respectivo referente común, con arreglo al cual proceder a la jerarquización de los respectivos datos analizados. 3. RESULTADOS Hemos conseguido jerarquizar datos de diferente naturaleza con arreglo a un aspecto que se da en todos ellos, el referente común. El parámetro que se encuentre en primera posición, (por ejemplo, en el caso del desarrollo, el país), implica que la suma de los niveles es la mayor de todas, y por tanto, también lo será su medida del desarrollo. En el otro extremo, se encontrará el parámetro (país) que con la medida más pequeña de todas, indica una situación en dónde los niveles alcanzados son los más bajos. Cuando se hace un análisis de Rasch, el siguiente paso es analizar el alcance con que los datos siguen las expectativas de la probabilidad de Rasch, para lo cual, se calcula un indicador de ajuste para cada parámetro, representado en las respectivas filas y para cada ítem, representado en las respectivas columnas. Esto resume la extensión por la cual el panel de datos de la muestra es consistente con la forma en que dichos datos son manifestaciones del referente común, proporcionando una consistencia de ajuste estadístico para cada uno de ellos. La validez viene determinada por la discrepancia entre una determinada observación y su valor esperado. Estos desajustes vienen expresados por sus residuales. Los desajustes, entonces, vienen a completar el proceso de obtención de la medida, donde la jerarquización se fundamenta. 4. CONCLUSIONES La categorización permite la comparación de datos heterogéneos, al reducirlos a una escala común, permitiendo comparar situaciones expresadas en unidades de distinta naturaleza. Esta categorización permite aplicar el modelo de Rasch para la determinación de una medida de un referente común en el conjunto de los datos, con objeto de encontrar una jerquización. 5 El Modelo de Rasch, proporciona también los desajustes, que nos permiten determinar hasta qué punto son coherentes los datos como manifestaciones del propuesto referente común. El Modelo de Rasch tuvo su concepción en educación, permitiendo jerarquizar a los alumnos según sus respectivos conocimientos, a través de las evaluaciones de un test de inteligencia. Las consideraciones expuestas a lo largo del presente trabajo contribuyen a ampliar el marco de aplicación del Modelo de Rasch. REFERENCIAS Álvarez, P., (2000). “Transforming non-categorical data for Rasch applications”. Third International Outcomes Measurement Conference: Measurement of healtcare outcomes. Nortwestern University Medical School. Chicago, Illinois, (USA). Álvarez, P. & Blanco, M.A. (2000). “Reliability of the sensory data of a panel of tasters”. Journal of the Science of Food and Agriculture, Vol. 80, pp. 409-418. ISSN 0022-5142. Álvarez, P., Blanco, M.A. & Guerrero, M.M., (1997b). “Modelo de Rasch: medida de aspectos cualitativos”. Actas de las V Jornadas de la Asociación Española de Profesores Universitarios de Matemáticas en la Economía y la Empresa, (ASEPUMA), pp 17 – 28. Málaga, (España). Álvarez, P., Blanco, M.A. & Guerrero, M.M., (1997c). “La variable latente calidad medida a través del Modelo de Rasch”. Actas de las V Jornadas de la Asociación Española de Profesores Universitarios de Matemáticas en la Economía y la Empresa, (ASEPUMA), pp 29 – 44. Málaga, (España). Álvarez, P., Blanco, M.A. & Guerrero, M.M., (1998a). “Análisis de la validez de los datos a través del Modelo de Rasch”. Actas de la XII Reunión Anual ASEPELTESPAÑA, (en CD-ROM). Córdoba, (España). Álvarez, P. & Galera, C. (2000). “Industrial Marketing Applications of Quantum Measurement Techniques”. Industrial Marketing Management, Vol. 30, pp. 13-22. ISSN 0019-8501. Álvarez, P. y Morán, J.C. (2001). “Medida del desarrollo humano para los países de la América Latina”. El Trimestre económico, Vol. LXVIII, número 270, pp. 195-208. Álvarez, P., Morán, J.C. & Wright, B. D., (1993). “Quality of life”. VII Objective measurement workshop. Emory University, Atlanta, Georgia. Álvarez, P., Ortiz, R. & Ruiz, R. (2001). “Dry bean cultivar characterisation by isoelectric focusing eleccctrophoresis in polyacrylamide gel”. Journal of the Science of Food and Agriculture, Vol. 81, pp. 1126-1131. ISSN 0022-5142. Álvarez, P. & Pulgarín, A., (1996a). “The Rasch model. Measuring the impact of scientific journals: Analytical Chemistry”. Journal of the American Society for Information Science, 47, 458-467. Álvarez, P. & Pulgarín, A., (1996b). “The Rasch model. Measuring information from keywords: The diabetes field”. Journal of the American Society for Information Science, 47, 468-476. 6 Álvarez, P. & Pulgarín, A., (1997a). “The diffusion of scientific journals analyzed through citations”. Journal of the American Society for Information Science, 48, 953958. Álvarez, P. & Pulgarín, A., (1998a). “Equating research production in different fields”. Information Processing & Management. Álvarez, P. & Pulgarín, A., (1999). “Measuring information throug topical subheadings of the Medline database: a case of study”. Journal of Information Science, Vol. 25, nª 5, pp. 395-402. Álvarez, P., Pulgarín, A. & Escalona, I. (2000). “What is wrong with obsolescence?”. Journal of the American Society for Information Science, Vol.51, nº 9, pp.812 –815. Andrich, D., (1988). Rasch Model for Measurement. Murdoch University. SAGE. Guerrero, M.M., (2001). “Diseño de la obtención de una medida en el ámbito del IRPF”. Tesis Doctoral. Departamento de Economía Aplicada y Organización de Empresas. Universidad de Extremadura, Badajoz, (España). Wright, B.D. & Stone M.H., (1979). Best Test of Design. University of Chicago; Mesa Press. 1 Este ejemplo se ha extraído de una investigación llevada a cabo con la metodología utilizada, para medir el desarrollo humano de los países de América Latina (Álvarez, P. y Morán, J.C., 2001) 7