LA MOROSIDAD EN LAS ENTIDADES FINANCIERAS: ANÁLISIS EN LA PROVINCIA DE LEÓN MURES QUINTANA, Mª Jesús Departamento de Dirección y Economía de la Empresa Universidad de León correo-e: ddemmq@unileon.es GARCÍA GALLEGO, Ana Departamento de Dirección y Economía de la Empresa Universidad de León correo-e: ddeagg@unileon.es VALLEJO PASCUAL, M. Eva Departamento de Dirección y Economía de la Empresa Universidad de León correo-e: ddeevp@unileon.es RESUMEN El riesgo, que es inherente a toda actividad económica, se convierte, en el caso de las entidades financieras, en un elemento esencial, dadas las características del negocio que desarrollan, debiendo hacer frente a un conjunto de riesgos, entre los que destaca el de crédito. Con el fin de valorar la morosidad, como forma de manifestación de dicho riesgo, se ha realizado un estudio empírico en la provincia de León, en el que se ha aplicado la técnica de regresión logística, mediante la cual se determinan los factores que influyen en el comportamiento de pago de los clientes. Palabras clave: Riesgo de crédito, morosidad, regresión logística. INTRODUCCIÓN El desarrollo de cualquier actividad empresarial lleva implícita la asunción de un determinado conjunto de riesgos, dado el entorno económico actual al que se enfrentan las empresas. Entendiendo por riesgo, en términos generales, la variabilidad del beneficio esperado o pérdida de valor económico, en el ámbito de la empresa se pueden encontrar distintos tipos de riesgo, a los que, en el caso de las entidades financieras o de crédito, se añaden otro conjunto de riesgos adicionales, que se pueden calificar como propios de la actividad que desarrollan, de los cuales el riesgo de crédito es el más importante al que deben hacer frente dichas entidades. En esta línea, el objetivo de nuestro estudio se centra en el análisis y evaluación de la morosidad, como una de las formas de manifestación del riesgo de crédito, para lo cual el presente trabajo comienza con una referencia a la evolución que han seguido los métodos aplicados en la valoración del riesgo por parte de la entidades financieras, y, en concreto, en cuanto a dicho riesgo, para desarrollar, a continuación, la técnica de regresión logística, que es la metodología aplicada en el análisis de la morosidad. Un último apartado se dedica al riesgo en las entidades financieras, con especial referencia al de crédito, que se estudia de forma empírica en entidades financieras de la provincia de León, mediante la aplicación de la técnica anterior a una muestra de clientes de las mismas, con el fin de determinar las variables que influyen en su comportamiento de pago, finalizando el trabajo con las conclusiones más relevantes extraídas del mismo. 1. VALORACIÓN DEL RIESGO DE CRÉDITO: EVOLUCIÓN Y MÉTODOS Tradicionalmente, la palabra “riesgo” ha tenido, en todas las actividades económicas, y muy especialmente en las entidades financieras, una connotación claramente negativa, de ahí que la gestión empresarial se haya caracterizado por la aversión a la asunción de riesgos por parte de los gestores, quienes tomaban la mayoría de decisiones tratando de evitar o minimizar cualquier tipo de riesgo, lo que era posible por la existencia de un entorno caracterizado por una reducida competitividad, economías cerradas y fuerte proteccionismo de los estados a sus empresas. En este contexto, el riesgo se contemplaba como una perturbación del normal desarrollo de la actividad financiera, algo negativo pero inevitable y que, en consecuencia, había 2 que controlar y limitar en la mayor medida posible. Así, en el caso del riesgo de crédito, los esfuerzos se centraban claramente en intentar distinguir los buenos clientes, los que devolverían el crédito, de los malos, que no lo harían, interpretándose la morosidad como una medida fundamental de la calidad del crédito, en cuanto que refleja el nivel de acierto de la entidad en la selección de sus clientes y en la solución de aquéllos que resultaron problemáticos. Aún más, riesgo se utilizaba a menudo como sinónimo de operación. Sin embargo, la corriente liberalizadora y de competitividad empresarial que se ha producido, ha convertido el riesgo en rasgo principal de las empresas, haciendo imposible la estrategia de aversión al riesgo, característica de la gestión empresarial tradicional. El riesgo en un factor esencial que hay que gestionar de forma adecuada para obtener una rentabilidad acorde con el nivel de riesgo que se asume, constituyendo ambos elementos, junto con la solvencia, los tres ejes de la gestión en el ámbito de las entidades financieras. Por tanto, se acepta la adecuada gestión del riesgo como elemento fundamental de la actividad financiera, surgiendo la necesidad de tipificar, cuantificar y controlar los distintos tipos de riesgos a los que se enfrentan las entidades financieras en el desarrollo de su actividad, para lo cual se plantean distintas formas o métodos de llevar a cabo esa gestión. Las técnicas utilizadas en la valoración del riesgo de crédito eran, en sus inicios, de corte univariante, contemplando el riesgo en función de una única variable, o de considerar varias, analizando cada variable por separado. No obstante, la asunción de riesgos depende de múltiples factores, por lo que las técnicas evolucionaron hacia modelos que incluyen una combinación de variables. Dentro de estos modelos de tipo multivariante, podemos distinguir aquéllos de carácter subjetivo, basados en el criterio y juicio de analistas expertos, quienes proceden a evaluar el riesgo de crédito y a tomar decisiones al respecto, sobre la base de sus conocimientos y experiencias acumuladas a través de años de trabajo. No obstante, el hecho de que varios analistas, a partir de idénticos elementos o factores, no puedan producir las mismas decisiones, sustenta la idea de que el criterio subjetivo de evaluación puede ser inconsistente e inestable, lo que hace necesaria la introducción de modelos objetivos de evaluación, basados en métodos estadísticos, que permiten la 3 uniformidad de las evaluaciones y evitan cualquier irregularidad resultante de una evaluación efectuada por uno u otro analista, ya que los mismos hechos producirán idénticos resultados cada vez que se apliquen, independientemente de quien utilice dichos métodos. Todas estas herramientas cuantitativas de medición del riesgo de crédito y, por tanto, los sistemas de control del riesgo, reposan sobre dos piezas básicas, como son el scoring y el rating, que permiten calificar el riesgo mediante una puntuación o una clasificación en grupos de riesgo, y que utilizan técnicas estadísticas como el análisis discriminante o los modelos de probabilidad condicionada, como el probit o logit. Así pues, queda justificada la utilización de métodos estadísticos en la valoración del riesgo de crédito, de los cuales hemos aplicado, en el estudio empírico realizado, el análisis de regresión logística, dadas las características de la variable objeto de estudio, que es cualitativa dicotómica o binaria, cuyas modalidades son la morosidad o no de un conjunto de clientes de entidades financieras. 2. METODOLOGÍA: ANÁLISIS DE REGRESIÓN LOGÍSTICA Puesto que la metodología aplicada en el estudio empírico es el análisis de regresión logística, a continuación vamos a desarrollar dicha técnica, describiendo los aspectos teóricos más relevantes de la misma. 2.1 EL MODELO DE REGRESIÓN LOGÍSTICA Dentro de las técnicas de predicción o dependencia, que analizan el comportamiento de una variable dependiente a partir de una serie de variables independientes, uno de los métodos más utilizados es el análisis de regresión, cuya aplicación exige el cumplimiento de unos supuestos básicos, en relación con el modelo y las variables incluidas en él, como el carácter métrico y continuo de la variable dependiente. Sin embargo, a menudo se dan, fundamentalmente en el campo económico, fenómenos que consisten en elegir entre un conjunto de alternativas posibles o en clasificar una serie de individuos en varios grupos, que no pueden representarse mediante una variable dependiente continua, lo que obliga a formular modelos específicos para este tipo de situaciones. De esta forma, surgen los denominados modelos lineales generalizados, 4 como alternativa al análisis de regresión cuando la variable dependiente no es continua, que modelizan la probabilidad de ocurrencia de un suceso, y utilizan distintas funciones, según sea el tipo de datos a analizar: si son binarios o dicotómicos (con dos categorías), categóricos (con más de dos) o discretos (variables de recuento). 2.1.1 Formulación del modelo Cuando la variable dependiente es dicotómica o binaria, como ocurre en el caso que analizamos, en el que se considera como variable a explicar la morosidad o no de un cliente, las dos modalidades de la variable vienen representadas por los valores uno y cero, que se interpretan como la ocurrencia y no ocurrencia del acontecimiento, respectivamente, por lo que se denominan también éxito y fracaso. Puesto que los modelos lineales generalizados modelizan la probabilidad de ocurrencia de un acontecimiento, en el caso de una variable dependiente dicotómica, permiten determinar la proporción de individuos que presentan la modalidad uno de dicha variable, es decir, la probabilidad de éxito, que se expresa como: i P( yi ) P( y 1/ x xi ) por lo que: E( y / xi ) i 1 (1 i ) 0 i ,, ,, i 1, 2n i 1, 2n . Si se quiere estimar el valor de la probabilidad, se puede expresar la variable dependiente como una función de las variables independientes, para lo cual se pueden elegir distintos tipos de modelos, de entre los cuales se selecciona el modelo que constituye la base del análisis de regresión logística. Una primera posibilidad es considerar el modelo clásico de regresión lineal, que da lugar al modelo lineal de probabilidad, pues la relación que se establece entre las variables es lineal: yi 0 1 x1i 2 x2i k xki i o en forma matricial: y X y por lo tanto: E ( y ) X Lo que sucede es que estamos estimando una probabilidad, que debe tomar valores entre cero y uno, y el valor estimado a partir del modelo yˆ Xˆ no garantiza que se verifique dicha restricción, pudiendo dar valores negativos o superiores a uno, por lo que se 5 considera el modelo de probabilidad lineal truncado, que restringe los valores estimados al intervalo cerouno: si X 0 0 X si 0 X 1 1 si X 1 Sin embargo, esta solución no es satisfactoria, ya que una pequeña variación del valor de las variables independientes produce en los extremos un salto muy grande, y esa discontinuidad provoca que la estimación del modelo sea inestable. Ello obliga a buscar otros modelos, como el denominado modelo probit, que utiliza la función de distribución normal estándar: 1 X 12 z 2 X e dz 2 Debido a su mayor facilidad de cálculo y a su interpretación más directa, es de mayor aplicación en el análisis de variables dicotómicas el modelo logit o de regresión logística, que aplica la función de distribución logística: ( X) eX 1 X 1 e 1 e X Basándonos en estas consideraciones, el modelo de regresión logística o logit puede formularse en términos de probabilidad, a través de la función logística, como: i e0 1x1i 2 x2i k xki x x k xki 1 e 0 1 1i 2 2i 1 1 e (0 1x1i 2 x2i k xki ) ,, i 1 , 2 n que estima la probabilidad de que se produzca el evento o de que un individuo elija la opción uno, dados determinados valores de las variables explicativas, aunque tiene el inconveniente de que no es lineal respecto a las variables independientes. Por tanto, se trata de buscar una expresión del modelo como una función lineal de las variables explicativas, lo que facilita su interpretación, y esto se consigue mediante la inversa de la función logística, que es el logit o logaritmo de la odds o ventaja de que un suceso ocurra, y se interpreta como la preferencia de elegir la alternativa uno de la variable respuesta, frente a la alternativa cero: logit i ln i 0 1 x1i 2 x2i k xki , , i 1 , 2 n 1 i 6 Una última expresión del modelo de regresión logística es la que estima la ventaja o preferencia (odds) de un individuo por la modalidad uno frente a la categoría cero de la variable dependiente, definiéndose como el cociente entre la probabilidad de que ocurra un acontecimiento y la probabilidad de que no ocurra, que es su complementaria: i e 1 i 0 1 x1i k xki e 0 e 1x1i e k xki e 0 (e 1 ) x1i (e k ) xki ,, i 1, 2 n 2.2 ESTIMACIÓN DEL MODELO DE REGRESIÓN LOGÍSTICA Una vez formulado el modelo de regresión logística, es preciso estimar los parámetros del mismo, para determinar la probabilidad de que acontezca el suceso. Como la variable dependiente es dicotómica, los errores no se distribuyen normalmente, por lo que no puede aplicarse el método de mínimos cuadrados y es preciso acudir al método de máxima verosimilitud, que permite estimar el valor de los parámetros desconocidos que maximizan la probabilidad de obtener el conjunto de observaciones, esto es, la función de verosimilitud, que se define a partir de la contribución de las observaciones a dicha función: n L() P( y1 , y2 yn ) i i (1 i ) y 1 y i i 1 Dado que este método permite obtener estimaciones de los coeficientes j que maximizan la función de verosimilitud, hay que derivar dicha función respecto a los parámetros, obteniéndose un conjunto de (k+1) ecuaciones, que se denominan ecuaciones de verosimilitud y cuya expresión es la siguiente: n [ yi i ] 0 i 1 n xij[ yi i ] 0 ,, j 1, 2k i 1 Sustituyendo el valor de las probabilidades en función de los parámetros de interés, , las ecuaciones de verosimilitud resultan en la siguiente expresión: y i xi n i 1 n x ˆ i xi i x ˆ i 1 1 e i i 1 n 1 de la que se obtiene el denominado vector de estimadores de máxima verosimilitud: ˆ ( X VX ) 1 X Vy * 7 donde: y * Xˆ V 1 ( y ˆ ) y siendo X la matriz que contiene los datos de las k variables explicativas para cada elemento, incluido el término constante, y V la varianza estimada de los valores observados, que es una matriz diagonal de orden n y cuyo elemento general es el producto de las probabilidades complementarias estimadas ˆ i 1 ˆ i . Además del método de máxima verosimilitud, existen otros métodos alternativos para estimar el valor de los parámetros, entre los que puede citarse el método iterativo de mínimos cuadrados ponderados, análogo al anterior, así como el método de mínimos cuadrados ponderados no iterativo y el de análisis de la función discriminante, si bien presentan algunos inconvenientes que limitan su aplicación. 2.3 INTERPRETACIÓN DEL MODELO DE REGRESIÓN LOGÍSTICA Como hemos expuesto, mediante el análisis de regresión logística se trata de determinar la probabilidad de que un evento concreto ocurra, en función de los valores observados para las variables independientes y de los coeficientes estimados por el modelo. Una vez estimado el valor de los parámetros, es necesario proceder a su interpretación, indicando el significado que tiene cada coeficiente en dicha probabilidad. En el modelo de regresión logística, al ser la variable dependiente categórica, el efecto de la probabilidad no es lineal, sino que varía con el valor de la variable independiente, por lo que es preciso expresar la variable dependiente como una función lineal de las variables independientes, lo que se consigue a partir de la transformación logit del modelo: ( x) logit[ ( x)] ln 0 1 x1 k xk 1 ( x) Esta expresión del modelo facilita la interpretación de los coeficientes de regresión logística, asimilándose a los de regresión lineal. De esta forma, se interpretan los parámetros del modelo como el efecto lineal de cambio de una unidad en una variable independiente en el logaritmo de la razón de probabilidades de un suceso, esto es, cada coeficiente refleja el cambio en el logit correspondiente a un cambio unitario en la variable independiente considerada. Ese cambio en el logit se interpreta mediante la introducción de una medida de asociación, denominada odds ratio o cociente de ventajas, que se define como la razón de la odds o ventaja de la probabilidad de ocurrencia de un suceso para un determinado 8 valor de la variable respecto a la odds para otro valor de la misma, y que indica cuánto más probable (o improbable) es que ocurra el suceso que se analiza entre los individuos que presentan cada categoría de la variable independiente (xj), esto es: ˆ x1 , x0 π̂( x1 ) odds( x1 ) 1 π̂( x1 ) β̂ ( x x ) e j 1 0 π̂ ( x ) odds( x0 ) 0 1 π̂( x0 ) La odds ratio es, normalmente, el parámetro de interés en regresión logística por su facilidad de interpretación, pero, debido a que su estimación tiene una distribución ˆ ˆ , asimétrica, las inferencias realizadas se basan en la distribución muestral de ln j que tiende a seguir una distribución normal. La distinta naturaleza y escala de medida de las variables independientes incluidas en el modelo de regresión logística, que pueden ser continuas o categóricas, con dos (dicotómicas) o más (politómicas) categorías, conlleva singularidades en cuanto a la interpretación de los coeficientes del modelo, por lo que vamos a considerar la interpretación de los parámetros para cada una de las posibles escalas de medida de las variables independientes. Si se analiza el efecto de una variable independiente dicotómica, codificada ˆ exp ˆ , por lo que el con los valores cero y uno, la odds ratio viene dada por: 1, 0 j logaritmo de la odds ratio es igual al coeficiente estimado. En este caso, la odds ratio mide cuánto más probable es que se presente el evento entre aquellos sujetos para los que la variable toma el valor uno, que entre aquéllos con valor cero. No obstante, pueden utilizarse otras formas de codificación, que influyen en el cálculo de la odds ˆ exp ˆ (a b) , donde a y b son los ratio estimada, siendo su expresión general: a,b j valores que representan cada una de las categorías. En el caso de una variable independiente politómica con q categorías, para su incorporación en el modelo, se construyen (q1) variables ficticias, que son variables dicotómicas cerouno, por lo que estamos ante el mismo caso que el anterior, si bien, la odds ratio representa, en este tipo de variables, el factor de cambio en la odds o ventaja de que ocurra el suceso cuando el sujeto pertenece a la categoría representada por la correspondiente variable ficticia frente al hecho de que 9 el individuo pertenezca a la categoría de referencia, que suele ser la primera modalidad de la variable categórica original. Cuando se trata de una variable explicativa continua, la odds ratio se interpreta como la variación en la odds de que ocurra el evento ante un cambio unitario en la variable, aunque en muchas variables independientes de tipo continuo que se incluyen en los modelos de regresión logística, es más relevante empíricamente considerar la influencia de un cambio de c unidades en la variable, siendo la odds ˆ ratio asociada: exp cˆ j . x c, x j j 2.4 EVALUACIÓN DEL MODELO DE REGRESIÓN LOGÍSTICA El siguiente paso en el análisis del modelo de regresión logística es la evaluación del mismo, al objeto de comprobar si las variables explicativas que se incluyen en el modelo están significativamente relacionadas con la variable respuesta, y de valorar la bondad y capacidad global del modelo para predecir adecuadamente el comportamiento de la variable dependiente. 2.4.1 Significación individual de los coeficientes de regresión logística En primer lugar, se procede a valorar la significación individual de cada variable explicativa, lo que se realiza mediante la comparación de los valores observados y los estimados a partir del modelo, tomando como base el logaritmo de la función de verosimilitud; en concreto, a partir del cociente entre las funciones de verosimilitud del modelo estimado y de un modelo saturado, que es aquél que contiene todos los parámetros posibles y, por tanto, ajusta perfectamente a los datos, obteniéndose el estadístico D, que se denomina deviance (o desvianza). Planteado el objetivo de valorar la significación de una variable independiente, se compara el valor del estadístico D para los modelos con y sin la variable incluida en la ecuación, obteniéndose el estadístico G ó cambio en la deviance debido a la inclusión de una variable explicativa en el modelo, que también se denomina 2 del modelo, ya que, bajo la hipótesis nula de que el coeficiente de la variable explicativa cuya significatividad se trata de evaluar, j, es cero, sigue una distribución 2 con un grado de libertad, que resulta de la diferencia de grados correspondientes a los dos modelos. Verosimili tud sin la variable G 2 ln Verosimili tud con la variable 10 Además del estadístico de cambio en la razón de verosimilitud, se han desarrollado otros tests similares, estadísticamente equivalentes, como los tests de Wald o de Store. El primero se define como el cuadrado del cociente entre el estimador de máxima verosimilitud del parámetro, β̂ j , y una estimación de su desviación típica, obtenida a partir de la matriz de varianzascovarianzas, para contrastar la hipótesis nula H 0 : ˆ j 0 , frente a la alternativa: H1 : ˆ j 0 : 2 ˆ Wj j ~ 2 ˆ ˆ S ( j ) con uno ó q1 grados de libertad, para variables categóricas con q modalidades. Por su parte, el test de Score o estadístico de puntuación de Rao se basa en la distribución de las derivadas del logaritmo de la función de verosimilitud, siendo su expresión: n STj x ji ( yi y ) i 1 ~ N (0 , 1) n y (1 y ) ( x ji x ) 2 i 1 Otro modo de evaluar la significatividad de los coeficientes de regresión logística es a través del estadístico RA de Atkinson, que mide la correlación parcial entre cada variable independiente y la variable dependiente: 2 W j 2k ˆ j Sˆ (ˆ j ) 2k RA 2 ln L(ˆ 0 ) 2 ln L(ˆ 0 ) donde Wj es el estadístico de Wald, k el número de parámetros estimados y L(ˆ 0 ) la función de verosimilitud del modelo que contiene sólo el término independiente o constante, y tomándose el signo del coeficiente de regresión estimado. 2.4.2 Validez del modelo Para comprobar la validez del modelo en su conjunto, se analiza la significación global de todos los coeficientes del modelo mediante contrastes de hipótesis, y la bondad de ajuste del mismo, a través de una serie de coeficientes y estadísticos, que permiten analizar la adecuación y eficacia del modelo para la predicción de la variable dependiente. 11 Mediante la significación del modelo se trata de analizar si el efecto conjunto de todas las variables independientes que se han incluido en el modelo, porque su contraste individual ha resultado significativo y han mostrado, por tanto, su relevancia en la predicción de la variable dependiente, es también significativo, para lo cual se utiliza el test G ó de razón de verosimilitud, que compara la función de verosimilitud del modelo nulo, que sólo contiene el término independiente o constante, y la del modelo estimado, con las k variables explicativas. A la hora de afrontar el estudio de la bondad de ajuste del modelo, se trata de analizar las desviaciones entre los valores observados de la variable respuesta y los estimados a partir del modelo, a través de una serie de medidas que se clasifican en tres grupos: las basadas en pruebas estadísticas de contraste de hipótesis, que se derivan de la comparación directa entre los valores observados y los estimados, y entre las que se incluyen los estadísticos Deviance y 2 de Pearson, y la prueba de Hosmer y Lemeshow. las que miden la capacidad o eficacia predictiva del modelo, que se obtienen de una tabla de clasificación, que resulta del cruce de los valores observados de la variable dependiente con una variable dicotómica cuyos valores se derivan de las probabilidades predichas por el modelo estimado. A partir de la tabla, se calculan una serie de índices que permiten cuantificar el grado o capacidad de predicción del modelo, y que se asientan, en general, en la reducción proporcional del error (PRE). las que son análogas al coeficiente de determinación múltiple (R2) del modelo de regresión lineal, que se deducen de la analogía entre el logaritmo de la verosimilitud del modelo nulo 2 ln L ˆ 0 y la suma de cuadrados total de la regresión lineal, y del logaritmo de la verosimilitud del modelo estimado 2 ln L ˆ con la suma de cuadrados residual, destacando el R2 de Cox y Snell y el de Nagelkerke. 2.4.3 Diagnosis del modelo La evaluación del modelo se completa con la diagnosis o validación del mismo, en la que se comprueba la posible existencia de datos atípicos y de observaciones influyentes. 12 Así, al abordar la diagnosis del modelo, deben identificarse, en primer lugar, aquellos sujetos para los cuales el modelo estimado no realiza un buen ajuste, al diferir sus valores observados de los predichos. La detección de estos datos atípicos o outliers se realiza mediante al análisis de los residuos del modelo, distinguiéndose los residuos deviance, de Pearson, y los residuos de Pearson estandarizados. Además, debe procederse también a identificar aquellas observaciones influyentes que provocan en los coeficientes estimados y en las predicciones realizadas un efecto desproporcionado, porque ejercen una gran influencia en el modelo. Para ello, se consideran en primer lugar los elementos leverage, que se interpretan como una medida de la influencia que los valores observados ejercen sobre los estimados, y otros índices que analizan la influencia de un caso individual son aquéllos que examinan el efecto o cambio que la eliminación de dicho sujeto tiene sobre el valor de los coeficientes estimados y de las medidas de bondad de ajuste global, 2 de Pearson y deviance. 2.5 SELECCIÓN DE VARIABLES EXPLICATIVAS El objetivo de todo análisis de regresión logística, como técnica incluida dentro de los métodos de análisis de regresión, es obtener un modelo que permita explicar el comportamiento de una variable dependiente dicotómica a partir de los valores observados de un conjunto de variables independientes, las cuales se seleccionan desde un punto de vista sustantivo y estadístico. Según el criterio sustantivo, el investigador decide incluir aquellas variables que muestran tener relación con la variable dependiente en función de la base teórica que sustenta sus hipótesis de investigación, si bien, siguiendo el criterio estadístico, sólo deben introducirse en el modelo aquéllas que tengan una capacidad de predicción de la variable respuesta estadísticamente significativa. Combinando ambos criterios, se busca un modelo parsimonioso, que, con el menor número posible de variables independientes, presente la mejor bondad de ajuste a los datos y, por consiguiente, un mayor poder explicativo de la variable dependiente. En determinaciones situaciones, puede interesar la inclusión en el modelo de todas las variables científicamente relevantes en la predicción de la variable respuesta, con independencia de su significación estadística. En este caso, se aplica el método de especificación confirmatoria. 13 En otras ocasiones, se busca un modelo parsimonioso que consiga el máximo poder explicativo y la mejor bondad de ajuste a los datos, pero con el menor número posible de variables. En este caso, hay que seleccionar, entre todas las variables posibles, un conjunto reducido, lo que se puede realizar a través de métodos secuenciales en que las variables se seleccionan para su inclusión o eliminación en función exclusivamente de criterios estadísticos y dentro de los que podemos distinguir: Procedimientos hacia delante, que comienzan con el modelo que sólo contiene el término constante, y se van incorporando al mismo las variables explicativas, en función de su grado de relación con la variable dependiente y de su significación estadística. Procedimientos hacia atrás, que comienzan de forma inversa a los anteriores, es decir, todas las variables independientes se encuentran incluidas en el modelo y se van eliminando del mismo las variables que no predicen la variable dependiente de forma significativa. Procedimientos por pasos sucesivos, que resultan de la combinación de los dos métodos anteriores, puesto que se van incorporando variables al modelo, como en el primer procedimiento, pero a cada introducción de una variable le sigue la comprobación de si alguna de las variables ya incluidas satisface los criterios de eliminación, por lo que, en este método, puede eliminarse en un paso posterior, una variable incluida en uno previo. Otro procedimiento alternativo a los métodos secuenciales es el de todas las regresiones posibles, que consiste en estimar todos los modelos, teniendo en cuenta las posibles combinaciones de variables independientes, y elegir entre ellos aquél que mejor se ajusta, según los criterios previamente establecidos. 3. LA MOROSIDAD EN LAS ENTIDADES FINANCIERAS La técnica de regresión logística que se ha descrito en el apartado anterior, se ha aplicado al análisis de la morosidad en las entidades financieras, por lo que vamos a referirnos al riesgo en dichas entidades, haciendo una breve referencia a los tipos de riesgos a que se enfrentan, y desarrollando, en mayor medida, el riesgo de crédito, que se ha valorado empíricamente en una muestra de clientes. 3.1 EL RIESGO EN LAS ENTIDADES FINANCIERAS 14 3.1.1 Concepto y tipos de riesgo El riesgo es inherente al mundo de los negocios y a la actividad económica, debido a que ésta se desarrolla en un ambiente de incertidumbre, que constituye una de las características principales del riesgo, junto con la aleatoriedad. De esta forma, surge el riesgo como la contingencia, probabilidad o proximidad de un daño o peligro; concretamente, supone la asunción de la posibilidad de sufrir una pérdida, y además está asociado al conflicto, es decir, se presenta ante situaciones diferenciadas entre las cuales es preciso elegir. De forma más completa, el riesgo puede definirse como la exposición a la posibilidad de pérdidas económicas y financieras, de daños en las cosas y en las personas o de otros perjuicios como consecuencia de la incertidumbre que origina el llevar a cabo una determinada acción. Como se observa en la definición, la incertidumbre es la característica fundamental del riesgo, presentándose en tres aspectos: en cuanto a la posibilidad de que se materialice una pérdida efectiva sobre la cuantía de la pérdida sobre el instante en que puede materializarse dicha pérdida. En un entorno de liberalización y mayor libertad de actuación empresarial, las entidades deben asumir riesgos en su toma de decisiones, a la hora de buscar la máxima rentabilidad. No obstante, así como el riesgo es una de las características del entorno económico actual al que se enfrentan las empresas, en el caso de las entidades financieras se convierte en un rasgo básico, debido a las características de su negocio, consistente en la concesión de créditos. Las entidades financieras asumen un riesgo cuando prestan recursos financieros – conceden créditos–, porque, en realidad, ceden unos recursos –los depósitos– que otros clientes, con excedentes y que buscan una rentabilidad, les han prestado, sin controlar posteriormente el destino y la utilización de los mismos. Por otro lado, el riesgo global en la actividad financiera resulta de la suma de distintos tipos de riesgos: a) Riesgo de mercado: supone la probabilidad de pérdida ante movimientos adversos en los precios de los instrumentos financieros en los mercados donde se tengan posiciones. En función de su causa, se distingue, a su vez: riesgo de posiciones en 15 divisas, riesgo de tipo de interés/precio, riesgo de operaciones con opciones y otros riesgos de mercado, como riesgo de correlación, de pago anticipado y de aseguramiento. b) Riesgo de crédito: corresponde al riesgo de pérdida que se puede producir ante el incumplimiento de los pagos adeudados a la entidad, y que presenta las siguientes modalidades: riesgo de contraparte o de sustitución, riesgo país, riesgo de liquidación o entrega y riesgo de emisor. c) Riesgo operacional y de tecnología: comprende una variedad de riesgos que se generan como consecuencia de la posible ocurrencia de sucesos inesperados, relacionados con la infraestructura operativa y tecnológica, tanto interna como externa, de la entidad. d) Riesgo de liquidez: entendiendo por liquidez la capacidad de transformar un activo en efectivo a los precios existentes en cada momento, sin incurrir en más pérdidas que las que, en su caso, imponga el mercado, puede definirse este riesgo como la posibilidad de que una entidad financiera no disponga de liquidez y no pueda hacer frente a sus compromisos vencidos. e) Riesgo legal: incluye un conjunto diverso de riesgos debido a que un contrato no pueda ser ejecutado en los términos previstos, comprendiendo el riesgo de documentación, el riesgo de legislación específica de cada país y el de capacidad de las contrapartes. 3.1.2 Riesgo de crédito De los distintos tipos de riesgo descritos, es el riesgo de crédito el más importante al que debe hacer frente una entidad financiera, debido a que la actividad principal que desarrollan se ve afectada en mayor medida por este tipo de riesgo. De forma genérica, podría definirse el riesgo de crédito como el posible quebranto que originaría a la entidad una variación en las condiciones y características de una contrapartida, que pudiese alterar la capacidad de ésta para cumplir con los términos contractuales de una operación. Más concretamente, el riesgo de crédito es la incertidumbre derivada de la posibilidad de sufrir un quebranto por el incumplimiento, ya sea por entrada en mora o impago definitivo, de alguna o de todas las obligaciones contractuales de la contraparte o contrapartida en una operación financiera. 16 Como se observa, en la definición del riesgo de crédito se hace referencia a las dos formas en que puede manifestarse dicho riesgo: el incumplimiento definitivo de las obligaciones de pago del deudor, lo que deviene en la insolvencia del mismo, o bien, la entrada en mora de la contrapartida, provocada por el retraso en dicho cumplimiento. Esta distinción aparece recogida en diversas Circulares del Banco de España, que realizan una clasificación del crédito respecto a su situación, entendida como estado de cumplimiento de sus obligaciones de pago ya vencidas y estudio de la capacidad financiera del deudor para atender a las futuras. En concreto, se consideran como morosos aquellos créditos y demás operaciones vencidos y no cobrados, sin mediar novación o prórroga, cuando hayan transcurrido más de tres meses desde su vencimiento, si bien, con carácter general, se emplea el calificativo de moroso para designar a la persona o deudor que se atrasa en el pago de sus deudas o en el cumplimiento de su obligación, al no efectuarlo en la fecha de vencimiento estipulado. El riesgo de crédito se clasifica en dos grandes tipos de riesgos: el riesgo de contrapartida, cuyo origen está en el cambio de solvencia, y el riesgo país, que surge por circunstancias distintas al riesgo comercial habitual, aunque dentro de cada uno de estos riesgos pueden establecerse, a su vez, otras clasificaciones, según distintos criterios, como el evento que genera el riesgo o la operación en que se manifiesta. Por otra parte, existen una serie de factores determinantes del nivel de riesgo que acompaña a toda operación que las entidades financieras formalizan con sus clientes: en primer lugar, las características de la operación, que hacen referencia al plazo o vencimiento del término de la misma, a su importe o cuantía, a la modalidad o tipo de instrumento de financiación solicitado y a la finalidad o destino de la inversión. También influye en el nivel de riesgo el conocimiento que se tenga del solicitante, para lo cual debe obtenerse información, tanto de origen interno, obtenida de bases de datos de la entidad, como de fuentes externas, que pueden provenir del propio cliente o bien de terceros, a través de consultas a registros. Por último, determinan el nivel de riesgo las garantías aportadas por el cliente, cuya presentación exige la entidad como medio para reducir el riesgo. 3.2 ANÁLISIS EMPÍRICO 17 Una vez presentados los riesgos a que deben enfrentarse las entidades financieras y, en especial, el de crédito, el presente trabajo se completa con un estudio empírico, cuyo objetivo es analizar y valorar la morosidad, como forma de manifestación de dicho riesgo, en las entidades financieras. Para llevar a cabo dicho estudio, se ha aplicado la técnica de regresión logística, a partir de la cual se determinan los factores que tienen mayor influencia en la morosidad de una muestra de clientes de entidades financieras, centrándonos en el caso de personas físicas –no se consideran, por tanto, personas jurídicas o sociedades– en las operaciones de crédito o préstamo que han formalizado para financiar la compra de bienes o la realización de actividades profesionales. 3.2.1 Selección de variables En base a los aspectos teóricos del modelo de regresión logística, el fenómeno de la morosidad se ha modelizado a través de una variable dependiente o respuesta dicotómica, siendo sus modalidades la ocurrencia y no ocurrencia de dicho acontecimiento, es decir, la morosidad y no morosidad de la operación, que se han codificado con los valores uno y cero, respectivamente. Por lo que se refiere a las variables independientes o predictoras que permiten explicar el comportamiento de la variable dependiente, se han seleccionado teniendo en cuenta la información que las entidades consideran a la hora de conceder créditos. A este respecto, hay que destacar que son tres los factores que devienen en la concesión del crédito: la personalidad del solicitante, que determina el riesgo de crédito (si el cliente pagará), así como la capacidad, referente a la disponibilidad de ingresos para pagar, y el capital, relativo a su situación financiera y patrimonial, que establecen el límite de crédito que puede concederse (si podrá pagar y cuánto). Sin embargo, además de los factores personales, profesionales y patrimoniales del cliente que las entidades tienen en cuenta a la hora de estudiar la concesión de créditos, el hecho de que un solicitante pueda hacer frente al pago también depende de las características de la operación que se formalice. De acuerdo con las consideraciones anteriores, las variables independientes seleccionadas para su posible inclusión en el modelo se clasifican en dos bloques: por un lado, variables relativas a la operación de crédito o préstamo, entre las que consideramos el importe solicitado, la duración o plazo de devolución del crédito, el 18 destino de la inversión, la procedencia de la operación y las garantías aportadas; por otro lado, variables relativas al perfil del solicitante, esto es, a sus características personales y profesionales, como la edad, el estado civil, cargas familiares, su situación laboral, ingresos, si ofrece compensaciones a la entidad o si tiene otras operaciones en las que se ha producido impago. Cada una de estas variables, con sus respectivas categorías, aparece en el anexo A1. 3.2.2 Muestra de entidades financieras Con el fin de determinar cuáles de las variables descritas son más relevantes y contribuyen en mayor medida a la explicación de la variable dependiente, que, como hemos comentado, es la probabilidad de que un cliente sea moroso, hemos considerado una muestra de clientes de entidades financieras, que se ha seleccionado mediante un muestreo por conglomerados en dos etapas. En la primera etapa, se consideró el tipo de entidad de la cual extraer la muestra de clientes, e intentando tener en cuenta las peculiaridades y disparidades entre las distintas entidades financieras, se seleccionaron tres tipos: un banco, una caja de ahorros y una cooperativa de crédito, las tres con implantación en la provincia de León. Determinadas las tres entidades de las que extraer la muestra de clientes, se tomó una muestra de conglomerados, considerando como tales las oficinas de las entidades y resultando un total de nueve sucursales, tres correspondientes a cada entidad, dentro de cada una se seleccionó una muestra aleatoria de clientes, entre todos aquéllos que tenían formalizada una operación de crédito o préstamo, fueran morosos o no. El procedimiento de selección por azar dio como resultado una muestra total de 70 clientes, de los cuales 18 son morosos y 52 cumplen con sus obligaciones de pago. Como se observa, aunque la proporción de clientes morosos es muy inferior a la de no morosos en la mayoría de entidades financieras, la muestra de casos seleccionados recoge una proporción elevada de clientes morosos en comparación con los clientes no morosos, en concreto un 26% de clientes morosos frente a un 74% de clientes no morosos en la muestra. Esto nos obliga a tomar con precaución los resultados obtenidos a partir de la muestra, ya que pueden no ser extrapolables a la población de clientes de la que se ha extraído la muestra, en la que la proporción de clientes morosos es bastante más pequeña, respecto a los clientes no morosos. 3.2.3 Análisis de resultados 19 Para analizar la muestra seleccionada de clientes, con el objetivo de determinar las variables más significativas en la predicción de la morosidad y estimar, a partir del modelo, la probabilidad de que un cliente sea moroso, se aplicó el análisis de regresión logística, que puede aplicarse a cada potencial variable independiente, en un estudio univariante, lo que permite determinar la relación entre cada variable explicativa y la explicada, el sentido de la misma y su significación. No obstante, puesto que, como en cualquier otro fenómeno económico, en el comportamiento de pago de un deudor y, por consiguiente, en la morosidad, influye más de una variable o factor, es preciso estimar un modelo multivariante, para lo cual pueden aplicarse distintos métodos de selección de variables. Una posibilidad es aplicar los métodos de selección de variables hacia atrás, que comienzan con todas las variables independientes incluidas en el modelo, y se van eliminando aquéllas que no explican de forma significativa la variable dependiente, si bien, presentan exactamente ese inconveniente, ya que deben introducirse todas las variables en el modelo, lo que supone estimar todos los coeficientes de las variables, cuando en realidad sólo algunas de ellas son significativas. Por todo lo anterior, y teniendo en cuenta que el objetivo del estudio es encontrar un modelo parsimonioso que, con el menor número posible de variables, tenga una elevada eficacia predictiva, se va a aplicar para la selección de las variables explicativas alguno de los métodos forward o hacia delante, que comienzan con un modelo que contiene sólo la constante, para ir añadiendo después las variables independientes en función de su significatividad y su relación con la variable dependiente. Además, una vez incorporada la primera variable en el modelo, se contempla la posibilidad de eliminar alguna de las variables ya incluidas, si deja de ser significativa en la explicación de la variable dependiente. En el programa SPSS, los métodos de selección de variables hacia delante pueden seguir como criterios para la introducción de variables el estadístico de Wald o el test de razón de verosimilitud o 2 del modelo. En este caso, hemos considerando como criterio el 2 del modelo, ya que si se aplica el método hacia delante basado en el cambio que tiene lugar en el estadístico de Wald cuando el modelo contiene la variable y cuando se excluye, el procedimiento concluye tras el primer paso, en el que sale la variable incluida, al no ser significativo el test, dando lugar al modelo inicial. 20 En base al criterio aplicado, el método se desarrolla en seis pasos, al final de los cuales el modelo contiene cuatro variables, puesto que cada una de dichas variables contribuye a mejorar el estadístico 2 del modelo, tal y como se muestra en la tabla siguiente: Variables en la ecuación Modelo final NUMIMPAG NUEVARES TRASPASO VEHICULO Cons tante B 25,484 14,929 13,557 11,765 -13,557 E.T. 205,829 712,545 131,010 131,007 131,002 Wald ,015 ,000 ,011 ,008 ,011 gl 1 1 1 1 1 Sig. ,901 ,983 ,918 ,928 ,918 Exp(B) 1,2E+11 3046306 772273,2 128712,2 ,000 Dos de las variables explicativas incluidas en el modelo hacen referencia a una característica de la operación, como es el destino de la inversión obtenida, en concreto si se destina al traspaso de un negocio o bien a la compra de vehículos; otra se refiere al perfil del solicitante, puesto que recoge si es de nueva residencia en la zona, mientras que el número de impagos anteriores, si bien hace referencia a la operación, también guarda relación con el cliente, por cuanto que es un indicador de su personalidad y naturaleza respecto al pago de sus deudas. A la vista de los coeficientes del modelo, se observa que las cuatro variables influyen positivamente en la probabilidad de que un cliente sea moroso, ya que todos tienen signo positivo. Esto significa que cuando la variable independiente aumenta en una unidad, el logaritmo de la odds de la probabilidad de ser un cliente moroso aumenta en el valor del coeficiente respectivo. Además, el valor de los coeficientes es muy alto, lo que implica que cambios en los valores de las variables independientes provocan grandes aumentos del logaritmo de la odds ratio. Una vez estimado el modelo a partir de los datos observados, el siguiente paso es valorar su significatividad global, puesto que la significación individual de cada coeficiente se ha considerado para la inclusión de las variables en la ecuación del modelo, mediante su contribución a la mejora del estadístico 2 del modelo. Este estadístico o test de razón de verosimilitud se aplica también para valorar la significación del modelo, siendo su valor de 71’92, que resulta ser significativo. Respecto a la bondad del ajuste, además del estadístico 2 del modelo, el programa calcula coeficientes similares al R2 calculado en regresión lineal, concretamente el R2 de 21 Cox y Snell y el R2 de Nagelkerke, cuyos valores respectivos, de 0’639 y 0’939, muestran que el ajuste realizado es bueno, al ser próximos a uno. Otro estadístico utilizado para valorar la bondad de ajuste del modelo es la prueba de Hosmer y Lemeshow, para lo cual se agrupan las observaciones, para cada uno de los dos grupos definidos por la variable dependiente, según una tabla de contingencia, obteniéndose un resultado significativo. A su vez, es interesante valorar la capacidad o eficacia predictiva del modelo, lo que se realiza a partir de la tabla de clasificación que se presenta a continuación, en la que se recogen los valores observados para la variable dependiente, distinguiendo entre clientes morosos (1) y no morosos (0), y los valores pronosticados según el modelo estimado, que permite predecir la probabilidad de que un cliente sea moroso, y utilizando un punto de corte de 0’5 para dichas probabilidades, clasificar a los individuos o clientes de la muestra en cada uno de los dos grupos. Tabla de clasificacióna Pronosticado Modelo final Obs ervado MOROSIDA MOROSIDA no sí 51 1 1 17 no sí Porcentaje global Porcentaje correcto 98,1 94,4 97,1 a. El valor de corte es ,500 Como se observa, la capacidad predictiva del modelo es alta, puesto que se consigue una tasa de aciertos del 97’1%, de los cuales están correctamente clasificados un 98’1% de clientes no morosos y un 94’4% de clientes morosos. CONCLUSIONES Con el presente trabajo, se ha pretendido analizar la morosidad en las entidades financieras, como forma de manifestación del riesgo de crédito, que es el principal tipo de riesgo que asumen dichas entidades, tomando como ámbito geográfico la provincia de León. Por ello, se ha comenzado por justificar la aplicación de técnicas estadísticas en la evaluación de los riesgos a que se enfrentan las entidades financieras, y, especialmente el riesgo de crédito. Debido a la necesidad de que la valoración del riesgo se lleve a 22 cabo de una forma objetiva, los métodos aplicados han evolucionado, pasando de fundamentarse en decisiones personales y subjetivas de expertos, a aplicar modelos matemáticos y estadísticos que permiten basar las decisiones en resultados objetivos, entre los que podemos citar el análisis discriminante y los modelos de probabilidad condicionada, como la regresión logística, que es la metodología aplicada en el trabajo. Por esta razón, se ha procedido a describir brevemente los aspectos teóricos más relevantes de dicha técnica, relativos a la formulación del modelo, a la estimación de los parámetros del mismo y a su interpretación, así como a la evaluación de la significación, tanto individual como del modelo en su conjunto, y la bondad de ajuste y validación del mismo. Todas estas consideraciones, que se han desarrollado desde una perspectiva teórica, se han llevado a la práctica, mediante la aplicación de la técnica expuesta al estudio del riesgo de crédito en las entidades financieras, por lo que se ha procedido a describir los riesgos a que se enfrentan dichas entidades en el desarrollo de su actividad, con especial referencia al riesgo de crédito, cuya principal manifestación es la morosidad. A continuación se ha realizado el estudio empírico, relativo al análisis de la morosidad en una muestra de clientes de tres tipos de entidades: banco, caja de ahorros y cooperativa de crédito, con el fin de determinar los factores de mayor influencia en la probabilidad de que sean morosos, de entre un conjunto de variables independientes seleccionadas para su inclusión en el modelo por ser relevantes en la predicción de la morosidad. En concreto, siguiendo un criterio de significación estadística, se ha estimado un modelo que contiene cuatro variables, relativas al número de impagos anteriores, si se trata de un cliente de nueva residencia en la zona, y si la inversión se ha destinado al traspaso de un negocio o a la compra de un vehículo, y cuya expresión, en términos del logaritmo de la odds o logit es la siguiente: P( y 1) ln 13,577 25,484 NUMIMPAG 14,929 NUEVARES 13,557TRASPASO 11,765VEHICULO P( y 0) Como se observa, todas las variables incluidas tienen un efecto positivo en la probabilidad de ser moroso, dado el signo de los coeficientes respectivos, por lo que un cambio unitario en el valor de las variables correspondientes, provoca un aumento en el 23 logit de la probabilidad de que un cliente sea moroso en el valor del coeficiente respectivo. Por su parte, la evaluación de la validez del modelo determina que tiene una alta bondad de ajuste y una elevada capacidad predictiva, puesto que clasifica correctamente un 97’1% de los clientes de la muestra, con una tasa de aciertos similar entre los clientes morosos y los no morosos, todo lo cual muestra que la técnica de regresión logística es una alternativa adecuada al análisis discriminante, que venían utilizando las entidades financieras en la evaluación de la morosidad, permitiendo la inclusión de variables explicativas tanto cualitativas como cuantitativas y no exigiendo la existencia de normalidad en la población de la que procede la muestra. BIBLIOGRAFÍA 1. Abad, F.; Vargas, M. (2002): Análisis de datos para las Ciencias Sociales con SPSS. Granada: Ed. José Carlos Urbano Delgado, S.L. 2. Aldrich, J.H.; Nelson, F.D. (1984): Linear Probability, Logit, and Probit Models. Sage University Paper Series on Quantitative Applications in the Social Sciences, 07-045. Beverly Hills: Sage Publications. 3. Alonso Martínez, C. (2001): "Credit scoring y consentimiento en la protección de datos". Perspectivas del sistema financiero, 72, pp. 85-91. 5. DeMaris, A. (1992): Logit Modeling: Practical Applications. Sage University Paper Series on Quantitative Applications in the Social Sciences, nº 07-086. Newbury Park: Sage Publications. 6. Doldán Tié, F.; Rodríguez López, M. (2002): La Gestión del Riesgo de Crédito. Métodos y modelos de Predicción de la Insolvencia Empresarial. Madrid: Ed. AECA Monografías. 7. González Sánchez, M. (2000): "Nuevas tendencias en la gestión de riesgos: riesgo de crédito". Perspectivas del sistema financiero, nº 69, pp. 59-92. 8. Hand, D.J. (2001): "Modelling consumer credit risk". IMA Journal of Management Mathematics, vol.12, nº 2, pp.139-155. 9. Hosmer, D.W.; Lemeshow, S. (2000): Applied Logistic Regresion, 2ª edición. New York: John Wiley & Sons. 24 10. Jovell, A.J. (1995): Análisis de regresión logística. Madrid: Centro de Investigaciones Sociológicas. 11. Kleinbaum, D.G. (1994): Logistic Regression: A Self-Learning Text. New York: Springer-Verlag. 12. Liao, T.F. (1994): Interpreting Probability Models: Logit, Probit, and Other Generalized Linear Models. Sage University Paper Series on Quantitative Applications in the Social Sciences, nº 07-101. Thousand Oaks: Sage Publications. 13. Menard, S.(2002): Applied Logistic Regression Analysis, 2ª edición. Sage University Paper Series on Quantitative Applications in the Social Sciences, nº 07-106. Thousand Oaks: Sage Publications. 14. Ruiz, G.; Jiménez, J.I.; Torres, J.J. (2000): La gestión del riesgo financiero. Madrid: Ediciones Pirámide. 15. Salas, V.; Saurina, J. (2002): "Credit Risk in Two Institucional Regimes: Spanish Commercial and Savings Banks". Journal of Financial Services Research, vol. 22, nº 3, pp. 203-224. 16. Saurina Salas, J. (1999): "Determinantes de la morosidad de las Cajas de Ahorros españolas". Investigaciones Económicas, vol. XXII, nº 3, pp. 393-426. 17. Soler, M.; Mirò, A. (2001): "Enfoques cuantitativos para el riesgo de crédito de particulares y su aplicación a realidades nacionales diferentes". Perspectivas del sistema financiero, nº 72, pp. 43-51. 18. Thomas, L.C. (2000): "A Survey of Credit and Behavioural Scoring: Forecasting financial risk of lending to consumers". International Journal of Forecasting, vol. 16, nº 2, pp. 149-172. 19. Tomàs, J.; Amat, O.; Esteve, M. (2002): Cómo analizan las entidades financieras a sus clientes. Barcelona: Ediciones Gestión 2000.com. ANEXO Anexo A1. Variables Variable individu morosida importe plazo Categorías Número de individuo 1, si el cliente es moroso; 0, si no lo es Importe del crédito, en miles de euros Duración de la operación, en meses 25 vivienda vehiculo activida cancedeu traspaso otrgasto 1, si el destino de la inversión es la compra o reforma de vivienda; 0, en otro caso 1, si el destino es la compra de vehículos; 0, en otro caso 1, si el destino es la compra de locales comerciales o activos para actividad profesional; 0, en otro caso 1, si el destino es la cancelación de deudas; 0, en otro caso 1, si el destino de la inversión es mercantil; 0, en otro caso 1, si el destino son otros gastos o compras; 0, en otro caso 1, si es por iniciativa del cliente; 2, de la entidad; 3, campaña de marketing; 4, otra persona física o jurídica; 5, proceden otra entidad tipointe 1, si fijo; 0, si es variable garperso 1, si se aporta garantía personal; 0, en otro caso garhipot 1, si se aporta garantía hipotecaria o real; 0, en otro caso garaval 1, si se aporta aval; 0, en otro caso edad Edad del cliente, en años estcivil 1, si es soltero; 2, casado/pareja; 3, separado/divorciado; 4, viudo cargafam Número de personas a cargo del cliente 1, por cuenta propia; 2, por cuenta ajena funcionario; 3, por cuenta ajena indefinido; 4, por cuenta ajena slaboral eventual; 5, por cuenta propia y ajena funcionario; 6, por cuenta propia y ajena indefinido; 7, por cuenta propia y ajena eventual; 8, jubilado/prejubilado; 9, desempleado ingresos Ingresos medios mensuales, en euros antigüed Antigüedad en el trabajo, en años propviv 1, si posee vivienda sin cargas; 2, posee vivienda con cargas; 3 no posee vivienda nuevares 1, si es de nueva residencia; 0, en otro caso nuevocli 1, si es nuevo cliente; 0, en otro caso compensa 1, si tiene compensaciones; 0, en otro caso numectas Número de cuentas del cliente otrasope 1, si tiene otras operaciones activas; 0, en otro caso numerope Número total de operaciones imptotop Importe total de las operaciones activas, en miles de euros numimpag Número de impagos anteriores duraretr Duración máxima del retraso, en meses 26