MODELO DE MINERÍA DE DATOS COMO HERRAMIENTA EFICIENTE PARA REALIZAR AUTORIZACIONES TRANSACCIONALES A LOS TARJETAHABIENTES DEL BANCO DAVIVIENDA S.A. PAOLA BELTRÁN HERRERA PONTIFICIA UNIVERSIDAD JAVERIANA FACULTAD DE INGENIERÍA CARRERA DE INGENIERÍA INDUSTRIAL BOGOTÁ, D.C. 2011 1 MODELO DE MINERÍA DE DATOS COMO HERRAMIENTA EFICIENTE PARA REALIZAR AUTORIZACIONES TRANSACCIONALES A LOS TARJETAHABIENTES DEL BANCO DAVIVIENDA S.A. PAOLA BELTRÁN HERRERA Trabajo de grado en el énfasis de Métodos Cuantitativos para optar al título de Ingeniera Industrial DIRECTOR JORGE ANDRÉS ALVARADO VALENCIA INGENIERO INDUSTRIAL PONTIFICIA UNIVERSIDAD JAVERIANA FACULTAD DE INGENIERÍA CARRERA DE INGENIERÍA INDUSTRIAL BOGOTÁ, D.C. 2011 2 TABLA DE CONTENIDO RESUMEN EJECUTIVO ......................................................................................................................... 8 1. 2. ANTECEDENTES........................................................................................................................... 9 1.1. SECTOR FINANCIERO EN COLOMBIA ................................................................................... 9 1.2. EL NEGOCIO DE LAS TARJETAS DE CRÉDITO.................................................................... 10 1.3. BANCO DAVIVIENDA S.A. .................................................................................................... 11 1.4. EL BANCO DAVIVIENDA S.A. Y EL SECTOR DE LAS TARJETAS DE CRÉDITO ..................... 13 1.5. TARJETAS DE CRÉDITO DENTRO DEL BANCO DAVIVIENDA S.A. ....................................... 15 1.6. FORMULACIÓN Y PLANTEAMIENTO DEL PROBLEMA ......................................................... 18 SITUACIÓN ACTUAL DEL PROCESO DE VALORACIÓN Y OTORGAMIENTO DE EXTRA CUPOS EN EL BANCO DAVIVIENDA S.A. ....................................................................................................... 20 3. 2.1. DEPARTAMENTO DE ANÁLISIS DE RIESGO DE CRÉDITO DEL BANCO DAVIVIENDA S.A. ... 20 2.2. DEPARTAMENTO DE MONITOREO DE MEDIOS DE PAGO DEL BANCO DAVIVIENDA S.A. ... 21 2.3. UNIDAD DE INTELIGENCIA DE NEGOCIOS DE LA VICEPRESIDENCIA DE MEDIOS DE PAGO DEL BANCO DAVIVIENDA S.A. ............................................................................................ 21 2.4. DESCRIPCIÓN DEL PROCESO ACTUAL .............................................................................. 22 2.4.1. Transacción a través de POS (nivel nacional).................................................................. 22 2.4.2. Transacción a través de ATM (nivel nacional).................................................................. 24 2.4.3. Transacción a través de ATM/POS (nivel internacional) ................................................... 24 2.5. POLÍTICAS Y GENERALIDADES DEL PROCESO ................................................................ 25 2.6. DIAGRAMAS DE PROCESO ................................................................................................. 27 2.6.1. Proceso de valoración y otorgamiento de extra cupos a través de POS a nivel nacional...... 28 2.6.2. Proceso de valoración y otorgamiento de extra cupos a través de ATM (propios y de otras redes) y canales propios a nivel nacional ....................................................................... 31 2.6.3. Proceso de valoración y otorgamiento de extra cupos a través de ATM de otras redes a nivel nacional ...................................................................................................................... 35 SISTEMA DE INFORMACIÓN RELACIONADO CON EL PROCESO DE VALORACIÓN Y OTORGAMIENTO DE EXTRA CUPOS EN EL BANCO DAVIVIENDA S.A. ........................................ 38 3.1. DESCRIPCIÓN DEL SISTEMA DE INFORMACIÓN ................................................................ 38 3.2. ESTRUCTURA DEL SISTEMA DE INFORMACIÓN................................................................. 39 3.3. PROCESO DE GENERACIÓN DE DATOS ............................................................................. 41 3.4. DIAGRAMAS DE PROCESO ................................................................................................. 43 3 4. 3.4.1. Diagrama de flujo del proceso de generación de datos relevantes para la elaboración de informes y toma de decisiones ...................................................................................... 44 3.4.2. Diagrama de contexto del Sistema de Información para la generación de información dentro del Banco Davivienda S.A............................................................................................. 45 3.4.3. Diagrama de Nivel 0..................................................................................................... 46 DICCIONARIO DE DATOS ............................................................................................................ 48 4.1. GENERALIDADES ............................................................................................................... 48 4.2. METODOLOGÍA ................................................................................................................... 49 4.3. VARIABLES INICIALES ........................................................................................................ 55 4.4. VARIABLES SELECCIONADAS ............................................................................................ 60 4.4.1. 5. MECANISMO DE MINERÍA DE DATOS ......................................................................................... 64 5.1. SELECCIÓN DEL MÉTODO A EMPLEAR .............................................................................. 64 5.2. DESCRIPCIÓN DEL MÉTODO .............................................................................................. 65 5.3. DESARROLLO DEL MODELO .............................................................................................. 67 5.3.1. 6. 7. Criterios para la selección de variables ........................................................................... 62 Definición de parámetros ............................................................................................... 67 5.4. CARACTERIZACIÓN DE LOS CLIENTES .............................................................................. 69 5.5. POLÍTICAS PROPUESTAS ................................................................................................... 81 PROPUESTA FINAL ..................................................................................................................... 84 6.1. DESCRIPCIÓN GENERAL .................................................................................................... 84 6.2. METODOLOGÍA PROPUESTA .............................................................................................. 84 6.3. OBJETIVO FINAL ................................................................................................................. 84 6.4. ASPECTOS IMPORTANTES ................................................................................................. 85 6.5. PROCESO INVOLUCRADO .................................................................................................. 85 6.5.1. Insumos de la propuesta ................................................................................................ 85 6.5.2. Procesos de la propuesta............................................................................................... 86 EVALUACIÓN DE LA PROPUESTA............................................................................................... 88 7.1. ANÁLISIS CUALITATIVO ...................................................................................................... 88 7.2. ANÁLISIS CUANTITATIVO ................................................................................................... 89 CONCLUSIONES ................................................................................................................................. 94 GLOSARIO DE TÉRMINOS .................................................................................................................. 96 BIBLIOGRAFÍA .................................................................................................................................. 101 A N E X O S ....................................................................................................................................... 105 4 LISTADO DE GRÁFICOS Gráfico 1. Actores del negocio de tarjetas de crédito. .............................................................................. 11 Gráfico 2. Porcentajes de participación del Banco Davivienda S.A. con respecto a otras 50 entidades financieras. .......................................................................................................................................... 13 Gráfico 3. Número total de tarjetas de crédito por entidad financiera. ........................................................ 14 Gráfico 4. Distribución de las franquicias de las tarjetas de crédito dentro del Banco Davivienda S.A. ......... 14 Gráfico 5. Situación actual de las tarjetas de crédito dentro del Banco Davivienda S.A. Datos acumulados (enero 2011 – junio 2011). ..................................................................................................................... 17 Gráfico 6. Total de declinaciones presentadas en tarjeta de crédito. Junio de 2011.................................... 18 Gráfico 7. Proceso de autorización de transacciones por fondos insuficientes a través de tarjeta de crédito. 19 Gráfico 8. Relación entre los departamentos del Banco Davivienda S.A. Producto tarjeta de crédito. .......... 22 Gráfico 9. Objetivos del almacén de datos del Banco Davivienda S.A. ...................................................... 39 Gráfico 10. Estructura del almacén de datos del Banco Davivienda S.A. ................................................... 40 Gráfico 11. Niveles del almacén de datos del Banco Davivienda S.A. ....................................................... 41 Gráfico 12. Proceso de obtención de datos a través del almacén de datos del Banco Davivienda S.A. ........ 43 Gráfico 13. Muestra de datos extraídos del Almacén de Datos. ............................................................... 48 Gráfico 14. Proceso para la selección de variables iniciales. .................................................................... 60 Gráfico 15. Proceso de análisis de conglomerados. ................................................................................ 66 Gráfico 16. Número de clientes por conglomerado. ................................................................................. 71 Gráfico 17. Número de clientes por conglomerado RAM. ......................................................................... 74 Gráfico 18. Proceso de valoración y otorgamiento de extra cupos propuesto. ............................................ 87 5 LISTADO DE TABLAS Tabla 1. Segmentación de las tarjetas de crédito otorgadas por el Banco Davivienda S.A........................... 16 Tabla 2. Segmentación de las tarjetas de crédito otorgadas a través de la modalidad de marcas compartidas. ........................................................................................................................................................... 17 Tabla 3. Ponderación aproximada de los porcentajes de extra cupos otorgados por el Banco Davivienda S.A. a través de las franquicias Visa y MasterCard, 2010. ............................................................................... 26 Tabla 4. Número y valor de las transacciones consultadas en ACIERTA a través de las franquicias Visa y MasterCard, 2010. ................................................................................................................................ 27 Tabla 5. Diccionario de datos de la base inicial de transacciones declinadas por fondos insuficientes .......... 51 Tabla 6. Diccionario de datos de la base inicial de tarjetas de crédito vigentes a julio de 2011..................... 52 Tabla 7. Diccionario de datos de la base demográfica del cliente. ............................................................. 53 Tabla 8. Diccionario de datos de la base agrupada por cliente. ................................................................. 57 Tabla 9. Diccionario de datos de la base agrupada por MCC. ................................................................... 59 Tabla 10. Diccionario de datos de la base agrupada por tarjeta de crédito. ................................................ 59 Tabla 11. Número y porcentaje de casos por conglomerado RAM. ........................................................... 74 Tabla 12. Denominación de los conglomerados. ..................................................................................... 76 Tabla 13. Descripción de las características de los conglomerados. .......................................................... 80 Tabla 14. Políticas por conglomerado..................................................................................................... 83 Tabla 15. Gastos por servicios de ACIERTA 2010. .................................................................................. 89 Tabla 16. Salario anual con factor prestacional por cargo......................................................................... 90 Tabla 17. Salario anual por cargos, incluidos los beneficios del Banco Davivienda S.A. .............................. 91 Tabla 18. Comparación entre la situación actual y los escenarios propuestos ............................................ 93 6 LISTADO DE ANEXOS ANEXO A. Las 50 Entidades Financieras de Colombia. Tomado de Revista Semana, Edición 1513, páginas 274 y 275. .......................................................................................................................................... 106 ANEXO B. Informe Tarjetas de Crédito. Superintendencia Financiera de Colombia. Mayo 2011. ............... 109 ANEXO C. Variables disponibles en el almacén de datos del Banco Davivienda S.A. ............................... 114 ANEXO D. Descripción de los MCC codificados. ................................................................................... 118 ANEXO E. Análisis previo de los datos. ................................................................................................ 122 ANEXO F. Transformación de las variables. ......................................................................................... 163 ANEXO G. Análisis Factorial................................................................................................................ 173 ANEXO H. Análisis de varianza con un sólo factor (análisis de 2)......................................................... 184 ANEXO I. Análisis de Conglomerados de K medias. .............................................................................. 232 7 RESUMEN EJECUTIVO Dado el desarrollo de las tecnologías disponibles, tanto de hardware como de software, y las grandes cantidades de información que se generan a través de estas, la mayoría de las organizaciones cuentan actualmente con una gran cantidad de datos disponibles, relacionados con el desarrollo de las diferentes actividades dentro de la empresa. La información que se puede encontrar al interior de las bases de datos es muy variada, y depende directamente de la razón de ser del negocio y la disponibilidad de herramientas para la recolección de los datos relacionados. De esta forma, la información con la que cuenta una empresa puede ir desde los datos básicos de los clientes, los empleados, los procesos, hasta información detallada de las operaciones de la empresa, las compras, las ventas, y transacciones en tiempo real que impliquen bases de datos totalmente dinámicas. La Minería de Datos y la generación de conocimiento a partir de la información disponible (KDD, por sus siglas en inglés, Knowledge Discovery in Databases) son dos herramientas básicas que se han desarrollado para abordar las grandes cantidades de información con las que cuentan las empresas. En muchos casos las organizaciones saben que cuentan con una gran cantidad de información, más sin embargo no saben cómo aprovecharla, de ahí que el objetivo general de la Minería de Datos sea extraer conocimiento valioso que permita posteriormente la generación de herramientas que soporten la toma de decisiones estratégicas, para mejorar los diferentes procesos dentro de las organizaciones (Kubski, 2004). En el caso específico del Banco Davivienda S.A. se identificó que el proceso relacionado con la valoración y otorgamiento de autorizaciones transaccionales ocasionales o extra cupos, presentaba una oportunidad de mejora, ya que se deseaba disminuir la cantidad de transacciones declinadas a sus tarjetahabientes, y a su vez, dadas las declinaciones, disminuir el número de consultas realizadas a agentes externos a la organización para la autorización de estas transacciones. La propuesta estuvo encaminada a conocer la información relacionada con la autorización de extra cupos con la que cuenta el Banco Davivienda S.A. actualmente; y a partir de esta, generar un mecanismo de Minería de Datos que permita a la entidad otorgarlos eficientemente a sus tarjetahabientes, disminuyendo el número de transacciones declinadas. El procedimiento metodológico que se llevó a cabo para el desarrollo del presente trabajo de grado, comenzó con: (i) la formalización del contexto real de las tarjetas de crédito y el Banco Davivienda S.A. en el país; seguido por (ii) la revisión, puesta en contexto y documentación del proceso actual de valoración y otorgamiento de extra cupos y el sistema de información relacionado con éste; luego (iii) el análisis de la información involucrada con el proceso; y finalmente, (iv) la formalización del modelo de Minería de Datos, junto con un evaluación de la propuesta, con el fin de determinar el costo – beneficio que conlleva su implementación dentro de la organización. Finalmente se pudo concluir que a través del análisis de conglomerados de K medias, se tuvo la posibilidad de generar políticas y estrategias de mercado personalizadas para cada uno de los grupos clientes. Cabe destacar que para el mejor entendimiento del presente documento existe un glosario de términos, en la parte final del mismo, para aquellos términos bancarios que no resulten claros al lector. 8 1. ANTECEDENTES A continuación se presenta el contexto en el que se desarrolla el presente trabajo de grado. 1.1. SECTOR FINANCIERO EN COLOMBIA Unos de los agentes más importantes del Sector Financiero en Colombia, y tal vez de los que más impulsan el crecimiento del sector, son los Establecimientos de Crédito. Dentro de éstos se encuentran comprendidos los Establecimientos Bancarios, las Corporaciones Financieras, las Compañías de Financiamiento Comercial, las Entidades Cooperativas de Carácter Financiero, los Organismos Cooperativos de Grado Superior y las Instituciones Oficiales Especiales –IOE o Banca de Segundo Piso (SUPERINTENDENCIA FINANCIERA DE COLOMBIA, 2011). La ley 45 de 1923 define a los Establecimientos Bancarios como: “todo individuo, corporación, sociedad, o establecimiento que hace habitualmente el negocio de recibir fondos en depósito general, o de hacer anticipos en forma de préstamos, o de efectuar descuentos, o cualesquiera de estas operaciones”. Actualmente en Colombia existen 23 establecimientos bancarios principales, dentro de los cuales se encuentran: Banco de Bogotá, Banco Popular S.A., Banco Santander S.A., Bancolombia S.A., Scotiabank Colombia S.A., Citibank – Colombia, HSBC Colombia S.A., Banco GNB Sudameris S.A., Banco Bilbao Vizcaya Argentina Colombia S.A (BBVA Colombia), Helm Bank S.A., Banco de Occidente, BCSC S.A, Banco Colpatria Multibanca Colpatria S.A., Banco Agrario de Colombia S.A., Banco Comercial AV Villas S.A., Banco ProCredit Colombia S.A., Banco de las Micro finanzas – Bancamia S.A., Banco WWB S.A., Banco Coomeva S.A., Banco Finandina S.A., Banco Falabella S.A., Banco Pichincha S.A. y el Banco Davivienda S.A. La constitución de estas entidades financieras en el país permite afirmar que la banca colombiana está controlada en su mayoría por instituciones de capital nacional, dejando alrededor de un 21% a la intervención de la banca extranjera (REVISTA SEMANA, 2011). El sector financiero en los últimos años ha venido tomando una gran importancia dentro de la población colombiana. Su desarrollo y penetración en el mercado se han dado principalmente por el adelanto de estrategias, por parte de las entidades bancarias y los diferentes establecimientos de crédito, para aumentar los portafolios de productos, haciéndolos de fácil acceso y ajustándolos a las necesidades de los diferentes clientes, de acuerdo con su nivel de ingresos (Cuellar, 2008). Según el artículo de la revista Dinero.com, La bancarización en Colombia llegó al 62%, en el país, la bancarización ha crecido en los últimos cinco años, demostrando que actualmente seis de cada diez personas mayores de 18 años, tienen al menos un producto financiero, pasando el indicador de bancarización del 51 por ciento en 2006 al 62 por ciento en 2011. El mercado de tarjetas de crédito es un claro ejemplo de este proceso de bancarización. De acuerdo con lo expuesto por María Mercedes Cuellar en su artículo Avances y obstáculos de la bancarización en Colombia, 9 los créditos de consumo y específicamente las tarjetas de crédito, son los productos con más fácil acceso y mayor cobertura en Colombia. Esto lo reafirma el informe de inclusión financiera 2006 – 2010 de la Asobancaria, donde se muestra que el 17 por ciento de la población adulta colombiana cuenta con al menos una tarjeta de crédito (Dinero.com, 2011). 1.2. EL NEGOCIO DE LAS TARJETAS DE CRÉDITO En el negocio de las tarjetas de crédito se involucran tres actores principales: por un lado se encuentran los tarjetahabientes, por otro lado los comerciantes y, finalmente, el enlace entre los dos anteriores: la plataforma. La interacción entre estos tres agentes permite que se lleven a cabo las transacciones comerciales, siendo los tarjetahabientes y los comerciantes los que actúan como demandantes del mercado, y la plataforma, como el oferente. Lo anterior implica que la plataforma es la encargada de vender el servicio de intermediación entre los demandantes (también es conocida como red). A este modelo de mercado, por la forma en que está constituida la relación entre sus agentes interventores, se le conoce como mercado de dos lados o de dos puntas (Arbeláez & Nieto, 2006). En este tipo de mercado los compradores y los comerciantes se complementan mutuamente (reciben beneficios en conjunto); ya que, el hecho de que existan tarjetahabientes que desean realizar transacciones comerciales, implica que los comercios deseen hacer parte de la red de medios de pago a través de tarjetas de crédito. Así mismo, sí existen comercios que estén dispuestos a recibir pagos con tarjeta de crédito, se propiciará que más consumidores deseen adquirir su tarjeta de crédito. Igualmente, sí estas condiciones no se presentan, no se hará necesaria la colocación de tarjetas de crédito, ni de redes de medios de pago en los comercios. El mercado de las tarjetas de crédito ha ido evolucionando a medida que las tecnologías de la información y los comercios se han ido constituyendo, desarrollando e incrementando (Peña Ayala, 2006). Actualmente, dentro del mercado de las tarjetas de crédito se ofrecen diferentes servicios y beneficios adicionales a los tarjetahabientes, lo que permite que el crecimiento de éste aumente considerablemente y cada vez se abarquen más segmentos de clientes. Dentro de la gran variedad de servicios que se ofrecen a los consumidores se encuentran: premios, programas de millas, avances en efectivo, seguros de viaje, seguros de automóviles, asistencia médica, asistencia en el hogar, entre otros. Las tarjetas de crédito ofrecen dos tipos de servicios: pagos a cuotas y pagos a cargo. Cuando se habla de pagos a cuotas, se hace referencia a la transacción de compra/pago que ha sido diferida a varios plazos; mientras que cuando se habla de pagos a cargo, se hace referencia a la transacción de compra/pago que se cobrará en su totalidad en el siguiente mes. Lo anterior implica que los tarjetahabientes deben asumir un cargo fijo mensual y el pago de intereses sí difieren sus pagos en el tiempo. Así mismo, los comerciantes deben cancelar una tarifa, que puede ser fija o variable, de acuerdo con el monto de la transacción realizada, y la plataforma debe asumir los costos asociados a la instalación de sus redes en los comercios. 10 En general, los tres actores de este tipo de mercado cumplen funciones específicas y conjuntas que permiten que el negocio de la tarjeta de crédito funcione adecuadamente. En la puesta en marcha del mercado de tarjeta de crédito, las partes involucradas asumen costos de acuerdo con su participación. El gráfico 1, presentado a continuación, ilustra la relación entre los diferentes actores del mercado. Gráfico 1. Actores del negocio de tarjetas de crédito. Fuente: La autora De lo anterior, es importante aclarar que el banco emisor es el encargado de la línea de negocio de tarjeta de crédito y, por lo tanto, es el banco que hace las colocaciones de tarjeta de crédito a sus clientes. Así mismo, el banco adquirente es el encargado de manejar las cuentas de las transacciones que se realicen en el comercio (cuentas de las tarjetas de crédito de otros bancos), para lo que pacta con los demás bancos el manejo de determinado comercio, cobrando un valor adicional a cada uno de ellos. 1.3. BANCO DAVIVIENDA S.A. El Banco Davivienda S.A., es una de las empresas que pertenecen al Grupo Empresarial Bolívar. Lleva 39 años participando en el sector financiero colombiano. Se constituyó en agosto de 1972 bajo el nombre de Coldeahorro, Corporación de Ahorro y Vivienda, y durante su trayectoria ha tenido diferentes cambios, a través de los cuales ha ido mejorando su servicio, aumentando el cubrimiento de clientes (a nivel nacional e internacional) y ampliando su portafolio de productos. En los últimos años se ha constituido como el tercer banco más importante de Colombia (DAVIVIENDA S.A., 2010). El Banco Davivienda S.A., dentro de sus políticas de mercado, tiene dos enfoques importantes de acuerdo con segmentos significativos de la economía del país. En primera medida, tiene un enfoque hacia la banca personal; es decir, ofrece productos a personas naturales, orientados a suplir sus necesidades financieras. 11 Por otro lado está la banca empresarial, la cual se refiere a las diferentes personas jurídicas que adquieren algún producto del portafolio ofrecido por el Banco Davivienda S.A., exclusivamente con fines empresariales. Durante la trayectoria del Banco Davivienda S.A. este ha mantenido, en su mayoría, una política enfocada a la banca personal, en la que ha dirigido su portafolio de productos a la promoción del ahorro y la financiación de vivienda. Sin embargo, en los últimos años, con la fusión de Granbanco S.A. – Bancafé y Davivienda, se ha incursionado en el mercado de la banca empresarial, ampliando las líneas de negocio a un segmento corporativo, oficial y empresarial. Dentro de la banca personal, con la fusión del Banco Superior a finales del 2004, el Banco Davivienda S.A. adquirió los productos y servicios especializados de tarjeta de crédito de éste, particularmente, la franquicia de la tarjeta de crédito Diners. Esta adquisición le permite al Banco Davivienda S.A. ofrecer a sus clientes un mejor servicio dentro de los créditos de consumo, lo que se evidencia en un portafolio de servicios mucho más completo (DAVIVIENDA S.A.). Según lo expuesto por la Revista Semana en su edición especial de Las 100 Empresas más grandes de Colombia (…y las 900 siguientes), el Banco Davivienda S.A. está posicionado como el segundo banco más importante de Colombia, comparado contra otras 50 entidades financieras en términos de Ingresos por Intereses en el 2010, con una participación total del 12%; como el cuarto banco más grande de Colombia en términos de Utilidades Netas en 2010, con una participación total del 8%; como el tercer banco en términos de Nivel de Activos en 2010, con una participación total del 10%; como el tercer banco en Cartera de créditos y operaciones de leasing, con un porcentaje de participación del 11%; ocupa el quinto puesto en Inversiones en 2010, con un porcentaje de participación del 6%; y finalmente, está posicionado como el tercer banco colombiano con respecto al Patrimonio, con una participación del 8% en 20101. El gráfico 2, presentado a continuación, resume lo expuesto anteriormente. 1 La información referente a las 50 entidades financieras de Colombia, publicada por la Revista Semana, en su edición especial del 2 de mayo de 2011, se encuentra en el Anexo A del presente documento. 12 Gráfico 2. Porcentajes de participación del Banco Davivienda S.A. con respecto a otras 50 entidades financieras. Fuente: (REVISTA SEMANA, 2011) De acuerdo con lo anterior es válido afirmar que el Banco Davivienda S.A. está consolidado como uno de los tres bancos más importantes del país. Esto lo ha ido logrando con la constitución de nuevas alternativas de negocio, enfocadas a dar cobertura a una gran variedad de clientes. Así mismo, su cultura empresarial dinámica y vanguardista, y el trabajo en equipo con las demás empresas que constituyen el Grupo Empresarial Bolívar. 1.4. EL BANCO DAVIVIENDA S.A. Y EL SECTOR DE LAS TARJETAS DE CRÉDITO De acuerdo con el informe emitido por la Superintendencia Financiera de Colombia acerca de las tarjetas débito y crédito para el período de mayo de 2011, se puede evidenciar que el Banco Davivienda S.A. actualmente es el establecimiento de crédito líder en emisión de tarjetas de crédito en el mercado colombiano. Cuenta con una participación del 20% del total de tarjetas de crédito disponibles en el mercado, que están representadas en sus franquicias Visa, MasterCard y Diners. Las principales entidades financieras en emisión de tarjetas de crédito son: Red Multibanca Colpatria, Tuya S.A., Bancolombia, CMR Falabella y el Banco Davivienda S.A., siendo este último el líder, en términos de número de tarjetas de crédito vigentes a la fecha de corte, vigentes en el mes, canceladas y bloqueadas temporalmente. El gráfico 3 resume esta información. 13 Gráfico 3. Número total de tarjetas de crédito por entidad financiera. Fuente: (SUPERINTENDENCIA FINANCIERA DE COLOMBIA, 2011) Por otro lado, el gráfico 4 representa la distribución del número de tarjetas de crédito por cada una de las franquicias del Banco Davivienda S.A.2 Gráfico 4. Distribución de las franquicias de las tarjetas de crédito dentro del Banco Davivienda S.A. Fuente: (SUPERINTENDENCIA FINANCIERA DE COLOMBIA, 2011) En general, se puede concluir que el Banco Davivienda S.A. es uno de los principales bancos de Colombia. Tiene la mayor participación del mercado en su producto de tarjetas de crédito, lo que lo constituye como un banco con grandes posibilidades en el sector de los créditos de consumo. Así mismo, el mercado de las La información relacionada con el Banco Davivienda S.A. dentro del sector financiero, específicamente en el producto de tarjeta de crédito se presenta en el Anexo B del presente documento. 2 14 tarjetas de crédito es bastante interesante para las diferentes entidades financieras, ya que es muy amplio y asocia unas rentabilidades considerablemente atractivas. De aquí que se haga necesario que el Banco Davivienda S.A. concentre sus esfuerzos en estudiar la posibilidad de generar alternativas de mejora en el proceso interno de este producto. 1.5. TARJETAS DE CRÉDITO DENTRO DEL BANCO DAVIVIENDA S.A. Dentro del gran portafolio de productos que ofrece el Banco Davivienda S.A. a sus clientes, se encuentran dos tipos de crédito: los créditos de consumo y los créditos comerciales. De acuerdo con lo estipulado en la circular externa 035 de 2005 de la Superintendencia Financiera de Colombia, los créditos de consumo se definen como: “los créditos otorgados a personas naturales para financiar la adquisición de bienes de consumo o el pago de servicios para fines no comerciales o empresariales, distintos a los otorgados bajo la modalidad de microcrédito”, y los créditos comerciales son definidos como: “los créditos otorgados a personas naturales o jurídicas para desarrollar actividades económicas organizadas”. De acuerdo con las políticas del Banco Davivienda S.A., actualmente se otorgan tarjetas de crédito tanto a personas naturales como a personas jurídicas. Esto implica que las tarjetas de crédito hacen parte de los productos de crédito de consumo y de los productos de crédito comercial. En general, el Banco ofrece a sus clientes una gran variedad de tarjetas de crédito. Esta emisión está ligada a una segmentación previa del mercado, en la cual a partir del perfil de ingresos y tipo de cliente se le otorga a cada uno una tarjeta de crédito específica que satisfaga sus necesidades y cumpla con sus expectativas. A continuación, en la tabla 1 se muestran las tarjetas de crédito que el Banco Davivienda S.A. otorga a personas naturales o personas jurídicas, con una breve descripción del segmento del mercado al que van dirigidas (DAVIVIENDA S.A., 2006). TARJETA DE CRÉDITO CARACTERÍSTICAS Platinum MasterCard y Visa • • • Clientes con ingresos iguales o superiores a $8.000.000. Clientes que requieren cupos altos. Viajeros frecuentes (negocios y/o turismo). Gold MasterCard y Visa • • • Clientes con ingresos superiores a $4.000.000. Clientes preferenciales del Banco. Clientes que requieren cupos altos. Clásica Davivienda MasterCard y Visa • • Clientes con ingresos iguales o superiores a $700.000. Clientes que están empezando su vida crediticia. 15 • Clientes con tarjeta MasterCard o Visa, que quieran apadrinar un familiar o amigo, que no cumpla con los requisitos estipulados por el banco para acceder a una tarjeta de crédito. • Clientes con ingresos iguales o superiores a un salario mínimo legal vigente. Clientes sin historial crediticio que desean obtener una tarjeta de crédito. El cliente adquiere tres productos: Certificado de Depósito a Término (CDT), Cuenta de ahorros con tarjeta débito y tarjeta de crédito. Amparada MasterCard y Visa • Garantizadas MasterCard y Visa • Empresarial Cuota fija • Exclusiva para clientes corporativos. • Clientes con ingresos iguales o superiores a un salario mínimo legal vigente. El valor de la cuota mensual a pagar es constante todos los meses. • • Tarjeta de crédito dirigida exclusivamente a mujeres que cuenta con beneficios y soluciones especiales de acuerdo a un nivel de ingresos específico. Signature Davivienda Visa • • • • Clientes con ingresos iguales o superiores a $12.000.000. Viajeros frecuentes (turismo o negocios). Clientes selectos del banco (exclusividad). Requerimiento de cupos altos. MasterCard Black • • • • Clientes con ingresos iguales o superiores a $15.000.000. Viajeros frecuentes (turismo o negocios). Clientes selectos del banco (exclusividad). Requerimiento de cupos altos. • Clientes exclusivos que vienen de la fusión Banco Superior – Davivienda. Clientes nuevos con ingresos iguales o superiores a $3.000.000. Beneficios de Diners Club International. Mujer Clásica y Premium Diners • • Tabla 1. Segmentación de las tarjetas de crédito otorgadas por el Banco Davivienda S.A. Fuente: (DAVIVIENDA S.A., 2006) Igualmente, el Banco Davivienda S.A. ofrece a sus clientes la posibilidad de adquirir tarjetas de crédito especializadas, con las cuales pueden acceder a beneficios exclusivos ofrecidos por los diferentes comercios, de acuerdo con sus intereses y preferencias. Estas tarjetas son ofrecidas con el respaldo de las dos franquicias: Visa y MasterCard. A continuación, en la tabla 2 se presentan algunas de las tarjetas de crédito que actualmente se ofrecen a través de la modalidad de marcas compartidas (DAVIVIENDA S.A., 2006). 16 FRANQUICIA MARCAS COMPARTIDAS VISA • • • Avianca Club Palatino Scare MASTERCARD • • Scar Uniandinos - Asosalud / Accome - Comfamiliar - MNG - Carulla - Santafé - 40 Principales - Easy - Buenvivir - Le Collezioni Tabla 2. Segmentación de las tarjetas de crédito otorgadas a través de la modalidad de marcas compartidas. Fuente: (DAVIVIENDA S.A., 2006) Por otro lado, según el Informe Gerencial de Tarjetas de Crédito que mensualmente actualiza la Unidad de Inteligencia de Negocios de la Vicepresidencia de Medios de Pago, para el período acumulado entre enero de 2011 y junio de 2011, la línea de negocio de tarjeta de crédito del Banco Davivienda S.A. presentó el siguiente comportamiento. Gráfico 5. Situación actual de las tarjetas de crédito dentro del Banco Davivienda S.A. Datos acumulados (enero 2011 – junio 2011). Fuente: (DAVIVIENDA S.A., 2011) De lo anterior se puede concluir que el Banco Davivienda S.A., a través de sus más de treinta clases de tarjetas de crédito, tiene cubierto un gran porcentaje del mercado de éstas en Colombia. La cobertura que ofrece con este producto va desde personas naturales con ingreso de salario mínimo, hasta clientes exclusivos con ingresos de $15.000.000 o más. Esto le permite abarcar diferentes estratos sociales, cubriendo las necesidades y satisfaciendo las expectativas de sus clientes actuales. 17 1.6. FORMULACIÓN Y PLANTEAMIENTO DEL PROBLEMA De acuerdo con el comportamiento histórico de las transacciones realizadas a través de las tarjetas de crédito, el Departamento de Monitoreo de Medios de Pago del Banco Davivienda S.A. ha identificado que dentro de las transacciones que registran sus tarjetahabientes (incluye cualquiera de las franquicias: Visa, MasterCard y Diners) se ha venido presentando un porcentaje significativo de transacciones rechazadas o declinaciones. Las declinaciones se presentan cuando el cliente desea acceder a comprar un bien o servicio, o cuando desea realizar un avance, y la transacción no se concluye exitosamente. Los dos canales por los cuales se registran estas transacciones son los ATM (por sus siglas en inglés, Automated Teller Machine), o cajeros electrónicos y las sucursales bancarias, utilizados en los casos de avances en efectivo; los POS (por sus siglas en inglés, Point Of Sale) o puntos de venta y las compras a través de Internet., utilizados en los casos de pago y/o compra de bienes y servicios a través de los datafonos de las redes de las franquicias. Analizando el origen de las transacciones declinadas se ha identificado que las causas que más se presentan son las siguientes: ATM: Fondos insuficientes, PIN inválido, tarjeta bloqueada, tarjeta vencida y otras. POS: Fondos insuficientes, tarjeta bloqueada, validación de fecha de vencimiento, código de seguridad errado, tarjeta robada o extraviada, código de establecimiento errado, datáfono inválido, tarjeta no existe y otras causas. El gráfico 6 presenta el número de transacciones que se registran a través de cada una de las causas identificadas. Gráfico 6. Total de declinaciones presentadas en tarjeta de crédito. Junio de 2011. Fuente: (DAVIVIENDA S.A., 2011) 18 De lo anterior se puede afirmar que la causa que representa el mayor porcentaje de ocurrencia en las dos tipos de canales existentes es la debida a Fondos Insuficientes (51% del total de las declinaciones). Se hace necesario entonces entrar a analizar la posibilidad de crear alternativas de mejora, para disminuir la cantidad de transacciones rechazadas por este concepto. Las declinaciones de tarjeta de crédito debidas a Fondos Insuficientes se presentan cuando un determinado cliente registra su tarjeta en un establecimiento comercial, en un cajero automático, o en otro canal habilitado por el Banco, y el cupo con el que cuenta en ese momento no es suficiente para permitirle adquirir un bien o servicio. Lo anterior implica para el Banco Davivienda S.A. que se dejen de generar transacciones, lo que está ligado directamente con la generación de ingresos. Igualmente se está produciendo un costo adicional; ya que, de acuerdo con los convenios que el Banco ha pactado con las redes dueñas de las franquicias (Visa y MasterCard), por cada transacción que se decline se cobra un valor adicional por el uso de la red, ya que se requiere de la consulta de una base de datos externa. Por otro lado, desde el punto de vista del cliente, una declinación por fondos insuficientes representa que está perdiendo la oportunidad de adquirir bienes y/o servicios por sobrepasar su cupo asignado. El gráfico 7 ilustra este proceso. Gráfico 7. Proceso de autorización de transacciones por fondos insuficientes a través de tarjeta de crédito. Fuente: La autora En este orden de ideas, se hace necesario determinar una forma eficaz para otorgar a los clientes una autorización transaccional, que le permita utilizar un cupo adicional en sus tarjetas de crédito, en ocasiones en las que su cupo disponible no sea suficiente para adquirir un bien o servicio específico. Cabe anotar que estas autorizaciones deben ser llevadas a cabo después del análisis de la información con la que cuenta el Banco Davivienda S.A. de sus tarjetahabientes, y sólo deben ser asignadas a aquellos clientes que lo necesiten y demuestren un comportamiento adecuado con el Banco. Es así que para el presente proyecto se determinó hacer uso de herramientas matemáticas y estadísticas, para establecer un modelo de Minería de Datos que permita al Banco Davivienda S.A analizar la asignación eficiente de autorizaciones transaccionales de sus tarjetahabientes. Es importante recalcar que el hecho de otorgar un extra cupo es totalmente diferente a aumentarle su capacidad, cupo o valor máximo asignado. 19 2. SITUACIÓN ACTUAL DEL PROCESO DE VALORACIÓN Y OTORGAMIENTO DE EXTRA CUPOS EN EL BANCO DAVIVIENDA S.A. El Banco Davivienda S.A. actualmente cuenta con una gran fuerza de trabajo distribuida en departamentos y unidades especializadas que le permiten llevar el control de los diferentes negocios de la entidad. Esta distribución se realiza de acuerdo con los productos ofrecidos a sus clientes y a las necesidades de control de la organización. Dentro de la situación específica de las tarjetas de crédito existe un gran número de departamentos involucrados en su gestión. Sin embargo, hay tres departamentos relevantes que se encargan del control, monitoreo, seguimiento (de clientes y del producto) y generación de políticas, que aseguran el correcto funcionamiento de las tarjetas de crédito, y que están alineados con las políticas internas del Banco Davivienda S.A. Estos departamentos son: Departamento de Análisis de Riesgo de Crédito, Departamento de Monitoreo de Medios de Pago y la Unidad de Inteligencia de Negocios de la Vicepresidencia de Medios de Pago. Con el fin de poner en contexto la relación de estos tres departamentos, la importancia dentro del proceso de valoración y otorgamiento de extra cupos, y las actividades que se llevan a cabo en cada uno de ellos, a continuación se presenta una descripción general de éstos. 2.1. DEPARTAMENTO DE ANÁLISIS DE RIESGO DE CRÉDITO DEL BANCO DAVIVIENDA S.A. El departamento de Análisis de Riesgo de Crédito se constituyó en el Banco Davivienda S.A. como consecuencia de una exigencia de la Superintendencia Financiera de Colombia, para controlar el riesgo asociado a cada uno de los clientes a los que la entidad les ha otorgado un crédito. Es el departamento encargado de calificar y evaluar las carteras de crédito del Banco, así como de constituir las provisiones necesarias para absorber las pérdidas esperadas de la exposición de los créditos desembolsados (DAVIVIENDA S.A., 2011). Dentro de las labores que se realizan en este departamento se encuentra la generación de modelos de calificación de crédito basados en la información disponible del cliente, para determinar categorías de riesgo y clasificar a los clientes de acuerdo con diferentes variables propias de cada uno (actuales e históricas), tales como: días de mora, créditos activos, nivel de ingresos, nivel de activos, endeudamiento, entre otras. En general, el objetivo del departamento es mantener un continuo seguimiento de los clientes de la entidad, para detectar su comportamiento crediticio y poder generar políticas que mitiguen el riesgo de desembolsar un crédito a una persona natural o jurídica. 20 Con respecto a los cupos otorgados en las tarjetas de crédito y, en general, a los valores máximos asignados en todos los créditos desembolsados, en este departamento se desarrollan modelos matemáticos alineados con las exigencias de la Superintendencia Financiera de Colombia, para determinar cuál será el valor del cupo total que puede ser otorgado a un determinado cliente. 2.2. DEPARTAMENTO DE MONITOREO DE MEDIOS DE PAGO DEL BANCO DAVIVIENDA S.A. El departamento de Monitoreo de Medios de Pago está constituido en el Banco Davivienda S.A. como una estrategia de negocio para dar seguimiento y control constante al comportamiento de las diferentes herramientas de pago que se le otorgan al cliente, como productos de la entidad. Dentro de los medios de pago comúnmente utilizados por los clientes se encuentran: las tarjetas débito y las tarjetas crédito. Este departamento es el encargado de controlar las diferentes redes de pago que se han puesto en los establecimientos comerciales (a través de datafonos y cajeros automáticos), con el fin de mantener un constante seguimiento de las transacciones que se realizan a través de éstas. En éste se desarrolla el análisis de la cantidad de transacciones realizadas en un período determinado, los montos de las transacciones, la cantidad de declinaciones y sus causas, entre otros indicadores relevantes para la gestión de estos medios de pago. 2.3. UNIDAD DE INTELIGENCIA DE NEGOCIOS DE LA VICEPRESIDENCIA DE MEDIOS DE PAGO DEL BANCO DAVIVIENDA S.A. La Unidad de Inteligencia de Negocios de la Vicepresidencia de Medios de Pago es la encargada de manejar los temas relacionados con los medios de pago de la entidad. Está encargada de generar reportes periódicos del comportamiento de las tarjetas débito y crédito, así como de proponer estrategias de expansión del negocio en diferentes segmentos comerciales. Las labores dentro de la unidad se miden en términos de adquisición de nuevos comercios (nuevas oportunidades de negocio para transar con las tarjetas de crédito disponibles y sus franquicias bajo la figura de Banco Adquirente), la expansión a nuevos nichos de mercado (marcas compartidas y otros) y el seguimiento y control de las tarjetas de crédito actuales. En la Unidad de Inteligencia de Negocios de la Vicepresidencia de Medios de Pago se encuentra disponible la información de la gestión de las tarjetas de crédito, así como la información acerca de su funcionamiento dentro del Banco Davivienda S.A. Esta información es suministrada al departamento por la gestión propia de su fuerza laboral, y por otras áreas del Banco que reportan información pertinente (en temas relacionados a la gestión de los medios de pago) de tarjetas de crédito. El gráfico 8 presenta la relación entre estos tres departamentos para la gestión del producto de tarjeta de crédito dentro del Banco Davivienda S.A. 21 Gráfico 8. Relación entre los departamentos del Banco Davivienda S.A. Producto tarjeta de crédito. Fuente: La autora 2.4. DESCRIPCIÓN DEL PROCESO ACTUAL El proceso actual de valoración y otorgamiento de extra cupos dentro del Banco Davivienda S.A. está determinado por las redes dueñas de las tarjetas de crédito. Para las tarjetas de crédito Diners, el dueño de la red es directamente el Banco Davivienda S.A.; para las tarjetas de crédito Visa la red propietaria es la Red Credibanco Visa; y para las tarjetas de crédito MasterCard la red dueña es Redeban Multicolor. El proceso inicia cuando un cliente realiza una transacción3 a través de los canales habilitados por el Banco Davivienda S.A.: POS, ATM y otros. El primer paso es determinar a qué red pertenece la tarjeta de crédito que ha sido presentada y de acuerdo con esto determinar cuál es el camino que debe seguir el procedimiento de acuerdo con lo estipulado por las redes y el Banco Davivienda S.A., es decir, que cada una de las redes tiene un procedimiento determinado (DAVIVIENDA S.A., 2009). Para entender mejor estos procedimientos a continuación se describen cada uno de ellos. 2.4.1. • Transacción a través de POS (nivel nacional) Caso 1: Tarjeta de crédito Diners Una vez se ha determinado que la tarjeta de crédito pertenece a la franquicia de Diners, se válida sí ha sido presentada ante un datáfono de la Red Credibanco o de Redeban Multicolor, o a través de un 3 Pueden ser en comercios nacionales e internacionales bajo la modalidad de compra/pago o avances en efectivo. 22 Autorizador del Banco Davivienda S.A. Seguido a esto, cada uno de los medios validan la información frente al Autorizador 73, Stratus ON/2, en el cual se almacena la base de datos de los clientes de tarjeta de crédito y es el medio a través del cual se determina sí se acepta la transacción o se declina por alguna razón. Sí la transacción ha sido declinada se revisa sí es debida a fondos insuficientes. Si es así, se autoriza teniendo en cuenta los parámetros autorizados por el Banco Davivienda S.A, si no, se declina la transacción. El Comité de Riesgo autorizó como política de funcionamiento de todas las tarjetas Diners, un extra cupo equivalente al 20% del cupo total otorgado en la tarjeta. Esta autorización abarca a todos los clientes Diners, siempre y cuando al momento de la transacción se encuentren al día con el Banco. • Caso 2: Tarjeta de crédito Visa Una vez se ha determinado que la tarjeta de crédito pertenece a la franquicia Visa, se válida sí ha sido presentada ante un datáfono de la Red Credibanco o de Redeban Multicolor, o a través de un Autorizador de la Red Credibanco. El medio encargado de la validación ante el Autorizador 73, Stratus ON/2, es la Red Credibanco; es decir que sí la transacción fue presentada ante Redeban Multicolor o el Autorizador de Credibanco, éstos deben enviar la transacción a la Red de Credibanco y esperar a que la red les responda sí se le autoriza o declina la transacción a ese cliente. Sí la transacción ha sido declinada por fondos insuficientes, la Red de Credibanco se encarga de validar la autorización o declinación de la transacción. Una vez se culmina la validación, se autoriza o no el extra cupo, y se le informa al cliente la decisión. La red se encarga de autorizar el extra cupo de acuerdo con un puntaje de riesgo. El puntaje de riesgo es un contrato de un modelo de ACIERTA entre la red dueña de la tarjeta de crédito y Datacrédito, para permitir la consulta en línea de la calificación del cliente y determinar de acuerdo con esto sí se le autoriza o no el extra cupo, y su monto. La información con la que se cuenta en el momento de otorgar el extra cupo corresponde a la información con corte a dos meses anteriores del mes en el que se está realizando la transacción. • Caso 3: Tarjeta de crédito MasterCard Una vez se ha determinado que la tarjeta de crédito pertenece a la franquicia MasterCard, se válida sí ha sido presentada ante un datáfono de Redeban Multicolor o de la Red Credibanco, o a través de un Autorizador de Redeban Multicolor. De la misma manera en que opera la Red Credibanco con sus tarjetas Visa, Redeban Multicolor es la red encargada de validar ante el Autorizador 73, Stratus ON/2 la autorización o declinación de las transacciones. Igualmente sí las transacciones han sido declinadas, se sigue el mismo procedimiento es el mismo que se realiza con las tarjetas de crédito de la franquicia Visa para determinar si se le otorga o no un extra cupo. 23 Con respecto a los extra cupos otorgados por cada una de las franquicias, es importante aclarar que todos los clientes del Banco Davivienda S.A. tienen autorizado este servicio. Los extra cupos son aprobados en línea en el momento de autorizar o declinar una compra. 2.4.2. • Transacción a través de ATM (nivel nacional) Caso 1: Avance en cajeros propios Cuando el cliente presenta su tarjeta de crédito (de cualquier franquicia) ante un cajero electrónico de la red del Banco Davivienda S.A. para realizar un avance en efectivo, el proceso interno que se lleva a cabo consiste en validar la información ante el Autorizador 31 o el Autorizador 38, los cuales están en línea con cada uno de los cajeros electrónicos disponibles, y éstos a su vez validan la información ante el Autorizador 73, Stratus ON/2 con el fin de permitir o declinar la transacción. • Caso 2: Avance en cajeros de otras redes En el caso en el que el cliente presenta su tarjeta de crédito ante cualquier cajero electrónico del comercio, es decir, cajeros electrónicos que están vinculados a otras redes, el proceso interno que se lleva a cabo consiste en enviar la transacción a la red dueña de la franquicia de la tarjeta de crédito, y luego éstos serán los encargados de autorizar o declinar la transacción. Sí la transacción ha sido rechazada por fondos insuficientes, las redes dueñas de las franquicias se encargan de consultar el archivo de ACIERTA proporcionado por Datacrédito, para determinar sí se le otorga o no un extra cupo a ese cliente. • Caso 3: Avance en canales propios El Banco Davivienda S.A. les permite a sus clientes realizar avances en efectivo a través de cualquiera de los canales que tiene habilitados para ello. Dentro de los canales del Banco se encuentran: Internet, Teléfono Rojo de Davivienda y las Sucursales Bancarias. Sí el cliente se presenta con su tarjeta de crédito ante cualquiera de estos canales para solicitar un avance en efectivo, el proceso que sigue la transacción consiste en que, a partir del canal se transmite la información al Integrador de Canales, se válida la información ante el Autorizador 31 y este a su vez válida la información ante el Autorizador 73 Stratus ON/2. Después de este proceso se determina sí se le autoriza o no la transacción al cliente. 2.4.3. Transacción a través de ATM/POS (nivel internacional) 24 • Caso 4: Autorizaciones Internacionales. El flujo de información surge cuando el cliente se presenta ante un comercio internacional. El proceso consiste en validar la información ante el Banco Adquirente, el cual, a su vez se encarga de contactar la red Visa/ Master Internacional, y estas últimas se contactan con la red nacional y validan la información de la misma manera que se hace en el comercio nacional. Para el caso de Diners, el Banco Davivienda S.A. se encarga directamente de la autorización a través de la plataforma tecnológica que tiene destinada para estas operaciones. 2.5. POLÍTICAS Y GENERALIDADES DEL PROCESO De acuerdo con las políticas que el Banco Davivienda S.A. ha establecido para el funcionamiento del proceso de valoración y otorgamiento de extra cupos dentro de la entidad, se ha estipulado que los canales a través de los cuales se les otorgan extra cupos a los tarjetahabientes dependen de la franquicia de la tarjeta de crédito y la propiedad del canal habilitado. Es decir, para la franquicia Diners se autorizan extra cupos a través de cualquier canal, y en las franquicias Visa y MasterCard solamente se realiza la autorización de extra cupos a través de POS a nivel nacional e internacional, de ATM de otras redes y a través de ATM a nivel internacional. Por otro lado, el proceso de valoración y otorgamiento de extra cupos a los tarjetahabientes del Banco Davivienda S.A. en las tarjetas de crédito de Visa y MasterCard, está directamente relacionado con la consulta de la base de datos de ACIERTA, en los canales mencionados anteriormente. En esta base está consignada toda la información histórica del cliente referente a su comportamiento crediticio, lo que implica que cada uno de los clientes tiene una calificación de crédito por su comportamiento histórico4. Adicionalmente, el tipo de tarjeta de crédito asignada al cliente (Clásica, Gold, Platinum) es otro parámetro que se tiene en cuenta para otorgarle al cliente una autorización transaccional. La tabla 3 presenta una ponderación aproximada de los parámetros que se tuvieron en cuenta en el año 2010 para el otorgamiento de extra cupos dentro del Banco Davivienda S.A. Una forma de medir el comportamiento histórico en los créditos de los clientes es a partir de la calificación de crédito, la cual está medida en términos de las alturas de mora que haya presentado el cliente en los últimos 36 meses (36 meses inmediatamente anteriores al período de corte en el que se esté analizando), junto con otras variables de comportamiento y un modelo de calificación establecido por la Superintendencia Financiera de Colombia. Las calificaciones van de la A hasta la E. Una calificación A implica que el cliente tiene un riesgo de incumplimiento normal (aproximadamente entre 0 y 29 días de mora), B un riesgo de incumplimiento aceptable (aproximadamente entre 30 y 59 días de mora), C un riesgo de incumplimiento apreciable (entre 60 y 89 días de mora), D un riesgo de incumplimiento significativo (entre 90 y 119 días de mora) y E un riesgo de incumplimiento incobrable (mayor o igual a 120 días de mora) (SUPERINTENDENCIA FINANCIERA DE COLOMBIA, 2005). 4 25 TRANSACCIONES INTERNACIONALES TRANSACCIONES NACIONALES FRANQUICIA PRODUCTO CALIFICACIÓN CLASICA VISA GOLD PLATINUM CLASICA MASTER GOLD PLATINUM %Nacional POS #Cuotas %Nacional #Cuotas #Cuotas %Nacional Nacional %Internal pagos Nacional Internal ATM pagos POS recurrentes POS POS recurrentes %Internal ATM A 20 24 10 10 12 20 12 10 B 15 24 10 10 12 15 12 10 C 0 0 0 0 0 0 0 0 A 30 24 15 12 12 30 12 15 B 20 24 10 8 12 20 12 10 C 0 0 0 0 0 0 0 0 A 40 24 20 10 12 40 12 20 B 30 24 15 10 12 30 12 15 C 0 0 0 0 0 0 0 0 A 20 24 10 10 12 20 12 10 B 15 24 10 10 12 15 12 10 C 0 0 0 0 0 0 0 0 A 30 24 15 12 12 30 12 15 B 20 24 10 8 12 20 12 10 C 0 0 0 0 0 0 0 0 A 40 24 20 10 12 40 12 20 B 30 24 15 10 12 30 12 15 C 0 0 0 0 0 0 0 0 Tabla 3. Ponderación aproximada de los porcentajes de extra cupos otorgados por el Banco Davivienda S.A. a través de las franquicias Visa y MasterCard, 2010. Fuente: (BANCO DAVIVIENDA S.A., 2010) Es importante destacar que el servicio de extra cupos no tiene costo adicional para el cliente, y que el manejo que se le da es el mismo que se realiza con las compras y avances; es decir, no implica ningún cambio en los parámetros de crédito ofrecidos al cliente en el momento de otorgarle su tarjeta de crédito. De igual manera el cliente desconoce que cuenta con el servicio de extra cupos, pero sí en algún momento desea no obtener este beneficio, puede pedir al Banco Davivienda S.A. que le sea anulado. Por otro lado, desde el punto de vista del Banco, el servicio de extra cupos tiene un costo, ya que la consulta de la base de datos de ACIERTA que ofrece Datacrédito es cobrada a la red (Visa, MasterCard), y estas a su vez, cobran este servicio al Banco Davivienda S.A. por cada transacción consultada (se genere extra cupo o no). En el caso en el que la transacción haya sido declinada, el Banco Davivienda S.A. cobra al tarjetahabiente la declinación de la transacción5 en la próxima factura. Finalmente, la tabla 4 presenta la información relacionada con el valor por transacción consultada en ACIERTA, el número de transacciones consultadas y el valor total de éstas en el año 2010. El valor promedio de cada transacción rechazada es de $5.000 y sólo le es cobrado a los clientes con tarjetas de crédito clásicas. Por políticas que el Banco Davivienda S.A. ha considerado para el funcionamiento de este producto, las tarjetas de crédito Gold y Platinum de las franquicias Visa y MasterCard, y las tarjetas de crédito Diners en cualquiera de sus segmentos están exentas de este cobro. 5 26 CREDIBANCO MES Cantidad Tx ENERO FEBRERO MARZO ABRIL MAYO JUNIO JULIO AGOSTO SEPTIEMBRE OCTUBRE NOVIEMBRE DICIEMBRE TOTAL 12.589 11.004 9.425 11.051 9.781 10.915 12.864 13.480 12.961 6.967 15.089 16.989 143.115 REDEBANMULTICOLOR Cantidad Tarifa ( $) Valor ($M) Tarifa ( $) Valor ($M) Tx 592 604 604 604 604 604 604 604 604 641 604 604 605 7.453 6.646 5.693 6.675 5.908 6.593 7.770 8.142 7.828 4.466 9.114 10.261 86.548 30.771 24.167 22.180 22.343 11.409 26.345 24.036 27.041 27.486 38.109 28.915 28.023 310.825 774 774 774 774 774 774 774 774 774 774 774 774 774 23.817 18.705 17.167 17.293 8.831 20.391 18.604 20.930 21.274 29.496 22.380 21.690 240.579 Tabla 4. Número y valor de las transacciones consultadas en ACIERTA a través de las franquicias Visa y MasterCard, 2010. Fuente: (BANCO DAVIVIENDA S.A., 2010) 2.6. DIAGRAMAS DE PROCESO Con el fin de comprender el proceso actual de valoración y otorgamiento de extra cupos en las transacciones realizadas a través de tarjeta de crédito de cualquiera de las franquicias, y en cada uno de los canales que el Banco Davivienda S.A. ha habilitado para ello, a continuación se presentan los diagramas de proceso correspondientes. En primera medida se hace una representación gráfica de cada uno de los procesos, seguido del respectivo diagrama de flujo. 27 2.6.1. 28 Proceso de valoración y otorgamiento de extra cupos a través de POS a nivel nacional 2.6.1.1. Diagrama de flujo del proceso de valoración y otorgamiento de extra cupos a través de POS a nivel nacional en la franquicia Diners 29 2.6.1.2. Diagrama de flujo del proceso de valoración y otorgamiento de extra cupos a través de POS a nivel nacional en las franquicias Visa y MasterCard 30 2.6.2. 31 Proceso de valoración y otorgamiento de extra cupos a través de ATM (propios y de otras redes) y canales propios a nivel nacional 2.6.2.1. Diagrama de flujo del proceso de valoración y otorgamiento de extra cupos a través de ATM propios a nivel nacional en las franquicias Diners, Visa y MasterCard 32 2.6.2.2. Diagrama de flujo del proceso de valoración y otorgamiento de extra cupos a través de ATM de otras redes a nivel nacional en las franquicias Diners, Visa y MasterCard 33 2.6.2.3. Diagrama de flujo del proceso de valoración y otorgamiento de extra cupos a través de canales propios a nivel nacional en las franquicias Diners, Visa y MasterCard 34 2.6.3. 35 Proceso de valoración y otorgamiento de extra cupos a través de ATM de otras redes a nivel nacional 2.6.4.1. Diagrama de flujo para el proceso de valoración y otorgamiento de extra cupos a través de POS / ATM a nivel internacional en la franquicia Diners 36 2.6.4.2. Diagrama de flujo para el proceso de valoración y otorgamiento de extra cupos a través de POS / ATM a nivel internacional en las franquicias Visa y MasterCard 37 3. SISTEMA DE INFORMACIÓN RELACIONADO CON EL PROCESO DE VALORACIÓN Y OTORGAMIENTO DE EXTRA CUPOS EN EL BANCO DAVIVIENDA S.A. El sistema de información actual del Banco Davivienda S.A. ha tenido varias adaptaciones como consecuencia de la fusión con el Banco Superior y Bancafé. Las tres entidades contaban con sistemas de gestión y administración diferentes, por lo que el Banco Davivienda S.A. debió tener en cuenta dentro del proceso de empalme, la integración de los clientes, la integración de las plataformas tecnológicas, la unificación de los empleados y los productos, y así mismo, asumir los riesgos que se generaron durante todo este proceso. A partir del año 2008, el Banco Davivienda S.A. impulsó una estrategia encaminada a desarrollar y ofrecer productos únicos y diferenciados, con los que se hacían necesarios, procesos de comunicación más eficientes, brindar un mejor servicio al cliente y mejorar las relaciones entre los involucrados (Cera Bilbao & Maya Quintero, 2009). El Banco Davivienda S.A. decidió apoyarse en tecnologías de la información para optimizar los servicios que se ofrecen a sus clientes y los procesos que se llevan a cabo dentro de la entidad. Fue así como se evaluaron las diferentes metodologías del Banco y las herramientas disponibles hasta el momento. Igualmente se hizo el análisis del costo – beneficio, con el fin de asegurar que las herramientas tecnológicas realmente se ajustaran a las nuevas necesidades de la organización. Actualmente el Banco Davivienda S.A. cuenta con un sistema de información más integrado que le permite tener acceso a múltiple información de sus productos, clientes, procesos, entre otros. El propósito general de éste es que todas las áreas de la organización que demanden información puedan tener acceso fácil y rápido a la bodega de datos, para extraer información que les sirva de soporte en procesos como: resolución de procedimientos operativos, integración de datos, generación de conocimiento y toma de decisiones. Para ello se han generado usuarios en cada una de las áreas involucradas (que han sido llamadas áreas clientes), y sólo a través de éstas se puede consultar y generar información (Ibídem, p.38). De esta forma, en este apartado se hace un contexto de la situación actual del sistema de información del Banco Davivienda S.A. relacionado con las tarjetas de crédito y los clientes de la entidad. Se hace una descripción general de las relaciones que existen entre las bases de datos de los clientes del Banco y la información del comportamiento y los movimientos del producto de tarjetas de crédito. 3.1. DESCRIPCIÓN DEL SISTEMA DE INFORMACIÓN El almacén de datos (DW, por sus siglas en inglés, Data Warehouse) con el que actualmente cuenta el Banco Davivienda S.A., trabaja en un entorno Oracle y es un modelo único de datos que suministra la información pertinente para el análisis y la toma de decisiones dentro de la organización; es decir, tiene una estructura integrada, organizada, dinámica y de fácil exploración y explotación, en la que sólo se dispone de información relevante de los diferentes procesos de la entidad. 38 Este almacén de datos fue construido a partir de un entorno de trabajo y procesos de datos orientados a satisfacer los requerimientos de información internos del Banco, y por lo tanto, es un repositorio de datos históricos de la entidad, para el cual sólo están permitidos dos tipos de operaciones: operaciones de carga de los datos procedentes de los aplicativos (carga inicial y carga periódica) y la operación de consulta de éstos (Ibídem, p. 38). El funcionamiento del almacén de datos del Banco Davivienda S.A. está ligado al cumplimento de tres objetivos fundamentales que están ceñidos a exigencias internas y externas de la organización6. El gráfico 9 representa dichos objetivos. Gráfico 9. Objetivos del almacén de datos del Banco Davivienda S.A. Fuente: Adaptado de (Cera Bilbao & Maya Quintero, 2009) 3.2. ESTRUCTURA DEL SISTEMA DE INFORMACIÓN7 El proceso de obtención y alimentación de información que va a ser depositada en el almacén de datos tiene dos componentes principales: la información relacionada con el cliente y la información relacionada con las transacciones realizadas a través de las tarjetas de crédito. Para el primer caso, el proceso se inicia cuando se les entrega un formulario a los clientes nuevos en una sucursal bancaria, se diligencia, y luego todo el Las exigencias externas hacen referencia al cumplimiento de la normatividad relacionada con el manejo de la información del cliente (almacenamiento, reporte y confidencialidad de la información). Las exigencias internas hacen referencia al cumplimiento de los requerimientos de información de la organización para llevar a cabo los procesos internos. 7 Esta información fue consultada directamente con el personal encargado de manejar el sistema de información. Las áreas consultadas fueron Planeación y Sistema de Información Gerencial del Banco Davivienda S.A. 6 39 consolidado de formularios diligenciados se envían al departamento de Evaluación de Crédito, donde se hace un cargue manual de dichos datos al sistema de información. Toda esta información reposa en el aplicativo BUK (Base Única de Clientes). En el segundo caso, la información viaja a la plataforma SEI (Sistema de Establecimientos e Intercambio) luego de haberse generado la transacción a través de alguna de las redes del Banco Davivienda S.A., o a través de las redes de algún otro establecimiento bancario. Esto implica que se registra la información de las transacciones realizadas a través de ATM, POS, Teléfono Rojo, Davivienda.com y Banca Móvil. Seguido a esto, la información organizada viaja al aplicativo FACT del AS400. Por otro lado, con respecto a los movimientos que se realizan en las tarjetas de crédito (cancelaciones, bloqueos, aumento de cupos, cambio de información del tarjetahabiente, entre otras) la información una vez generada, viaja directamente al aplicativo FACT. Adicionalmente, sí un usuario desea hacer una consulta de la información allí consignada, el proceso que se sigue es: primero, se hace la consulta de la información en un entorno SQL (sí el área que demanda la información no tiene acceso a ésta, se debe hacer un requerimiento de información a las áreas autorizadas para consultar la información); segundo, una vez obtenida la información se consolidan las bases de datos en documentos de Excel o Access (dependiendo del tamaño de la base de datos); y finalmente, se realiza el intercambio de información con el área o persona que haya requerido la información. El intercambio de información se realiza a través del correo interno del banco, o en muchos casos, a través de carpetas compartidas habilitadas entre los usuarios de las diferentes áreas. El gráfico 10 presenta la estructura del almacén de datos actual relacionado con las tarjetas de crédito y los tarjetahabientes del Banco Davivienda S.A. Gráfico 10. Estructura del almacén de datos del Banco Davivienda S.A. Fuente: La autora 40 Igualmente, para que la información pueda ser consolidada en el almacén de datos, éste debe contar diferentes niveles, de acuerdo con la etapa del manejo de los datos. El gráfico 11 presenta los niveles con los que cuenta el almacén de datos del Banco Davivienda S.A. Gráfico 11. Niveles del almacén de datos del Banco Davivienda S.A. Fuente: La autora. 3.3. PROCESO DE GENERACIÓN DE DATOS Como se ha expuesto anteriormente, el almacén de datos con el que cuenta el Banco Davivienda S.A. sirve como base para la realización de las actividades y labores de las áreas involucradas en la toma de decisiones y generación de estrategias que mejoran constantemente el negocio. El área de Informática del Banco Davivienda S.A. es la encargada de obtener, organizar y arreglar la información que reposa en el almacén de datos. La realización de estas tareas requiere de un proceso organizado en el que se extrae, limpia y transforma la información relevante para que después pueda ser consultada y manipulada por los usuarios de la entidad. El proceso que se sigue comienza con la extracción de la información, en el que se determina cuáles serán las fuentes de información, qué datos se desean almacenar, cómo se van a organizar y la disponibilidad de éstos en el tiempo. En el caso específico del producto de tarjeta de crédito, el almacén de datos obtiene la información de los movimientos, los saldos y la información transaccional directamente de los dispositivos y aplicativos que el Banco Davivienda S.A. ha dispuesto para ello (Cera Bilbao & Maya Quintero, 2009). El siguiente paso es la limpieza y transformación de los datos obtenidos, en éste se corrigen los errores en los datos, se valida la información, se identifican datos ausentes, se limpian y manejan las excepciones, se eliminan los duplicados e inconsistencias, se borran los campos que no generan interés, se generan claves, se adicionan datos, se homogenizan los datos y se realizan todas las actividades que sean pertinentes para asegurar que la información que vaya a ser consultada por los usuarios sea útil, oportuna y genere valor en los procesos. Culminado este proceso se procede a cargar los datos en el almacén de datos, dentro del cual 41 además de introducir los datos al almacén, se tienen en cuenta algunos controles de calidad de la información (Ibídem, p. 41). Es importante destacar que los controles en la calidad de los datos están encaminados a asegurar que la información que está disponible es confiable y corresponde a los requerimientos de los diferentes niveles del almacén de datos dentro de la organización. El personal encargado no tiene permisos para manipular, extraer o modificar la información que se carga, ya que a través de bloqueos en los permisos al acceso a la información, tan sólo se pueden hacer modificaciones y limpieza a los datos teniendo en cuenta unos parámetros específicos. En general, el personal sólo está habilitado para modificar la forma de los datos (con el fin de estandarizar la información contenida en el almacén de datos), más no tiene la posibilidad de eliminar o cambiar datos. Algunas de las validaciones más comunes están relacionadas con los datos numéricos que contiene el Sistema de Información, es así como se rectifican características como: los separadores de miles, los separadores de decimales, los rangos de edad permitidos, el tamaño del campo que contiene los números de cédula, el tamaño del campo que contiene los números de producto, entre otros. Este proceso requiere de especial cuidado ya que por disposiciones legales, la información contenida en las bases de datos del Banco Davivienda S.A. debe ser custodiada permanentemente para impedir la fuga o manipulación indebida de la información. Esto con el fin de evitar la exposición de información sensible de los clientes (datos personales y/o datos de comportamiento transaccional o de productos) y asegurar que las áreas y departamentos que hacen uso de esta información puedan llevar a cabo correctamente los procesos internos de la entidad. Una vez se tiene lista la información le es informado a los usuarios que ya se encuentran disponibles los datos y que a partir de ese momento se pueden empezar a realizar consultas. Las consultas sólo se hacen posibles después de que el área de Informática haya definido el orden de las fases de carga y la periodicidad de la información, pues esto evita que se viole la seguridad de la información, la carga se pueda realizar con mayor facilidad, y sí es necesario, se pueda hacer un mantenimiento al almacén de datos. Todo lo anterior para que las consultas sean realizadas sin saturar el funcionamiento del almacén de datos. Estas actividades se realizan mensualmente a través de un sistema especializado llamado ETL (por sus siglas en inglés, Extraction, Transformation, Load). Adicionalmente, se llevan a cabo actividades como copias de seguridad y restauración de la información que reposa en el almacén de datos y de la información que circula desde las fuentes hasta el almacén de datos (Ibídem, p. 41). El área de Informática del Banco Davivienda S.A. ha definido que la periodicidad de la información disponible no debe ser mayor a dos años, por lo que los procesos de copias de seguridad tienen como objetivo guardar la información que supera este período de tiempo y no se encuentra disponible en la bodega de datos (Ibídem, p. 41). El gráfico 12 ilustra el proceso descrito anteriormente. 42 Gráfico 12. Proceso de obtención de datos a través del almacén de datos del Banco Davivienda S.A. Fuente: La autora. Una vez los datos están listos y cargados en el almacén de datos los usuarios tienen la posibilidad de consultar dicha información. Para ello se debe seguir un procedimiento que empieza con la definición de los datos que se requieren, el estudio del requerimiento, la extracción de la información de la bodega y la consolidación de bases de datos para su posterior análisis y generación de conocimiento. 3.4. DIAGRAMAS DE PROCESO A continuación se presenta el diagrama de flujo de proceso, el diagrama de contexto y el diagrama de nivel cero, con el fin de representar con claridad el proceso de generación de datos a través del almacén de datos del Banco Davivienda S.A. 43 3.4.1. Diagrama de flujo del proceso de generación de datos relevantes para la elaboración de informes y toma de decisiones BANCO DAVIVIENDA S.A. No. 008 Pág. 1 de 1 PROCEDIMIENTO: Generación de datos relevantes para la elaboración de informes y toma de decisiones. DEPARTAMENTO: Áreas clientes del Almacén de Datos. Caso: Unidad de Inteligencia de Negocios de la Vicepresidencia de Medios de Pago. UNIDAD DE INTELIGENCIA DE NEGOCIOS DE LA VICEPRESIDENCIA DE MEDIOS DE PAGO ALMACÉN DE DATOS ÁREA DE INFORMÁTICA INICIO Realizar el requerimiento de información Enviar requerimiento al Almacén de Datos ¿La información se encuentra disponible en el DW? ¿La información es necesaria para la toma de decisiones? Recibir el requerimiento de información Recibir el informe del Almacén de Datos Evaluar el requerimiento ¿La información será útil para otras áreas? SI NO 1 SI NO Extraer la información requerida Buscar información en fuentes alternas Validar la información extraída Extraer la información requerida ¿La información es consistente? NO Comunicar la inconsistencia al área de Informática SI Realizar los cruces necesarios SI Solicitar la información en el área interesada NO Desarrollar el requerimiento Informar al área demandante de información Entregar informe al área de Informática Desarrollar el requerimiento de información Validar la información solicitada Cargar la información al almacén de datos Informar sobre la disponibilidad de la información en el DW SI ¿Se deben realizar cruces con otras bases de datos? 1 NO Analizar la información disponible Revisar las inconsistencias Generar informes y tomar decisones FIN Fecha: Julio de 2011 Elaborado por: Paola Beltrán Herrera 44 Estado: ACTUAL 3.4.2. Fecha: Julio de 2011 45 Elaborado por: Paola Beltrán Herrera Estado: ACTUAL Diagrama de contexto del Sistema de Información para la generación de información dentro del Banco Davivienda S.A. Diagrama de Nivel 0 Fecha: Julio de 2011 3.4.3. 46 Elaborado por: Paola Beltrán Herrera Estado: ACTUAL En general, el sistema de información que permite la generación de datos dentro del Banco Davivienda S.A. es una herramienta importante para el correcto funcionamiento de las áreas encargadas de generar informes y tomar decisiones dentro de la entidad. Sin embargo, aunque se tiene un proceso ya determinado y que está en constante desarrollo y mejora, éste aún presenta algunas fallas que interrumpen y retrasan las labores que se desarrollan en cada una de las áreas que requieren de esta información. Uno de los mayores inconvenientes con respecto a la generación de datos es que los requerimientos de información tardan mucho tiempo en ser analizados por el área encargada, pues se deben atender los requerimientos en el orden de prioridad y necesidad de la información. Adicionalmente, se debe tener presente que las bases de datos resultantes pueden contener algunos datos faltantes y errores (a pesar de que antes de que la información sea cargada al almacén de datos, éstos pasan por un proceso de limpieza) los cuales deben ser identificados y arreglados previamente, para poder llevar a cabo el proceso de generación de conocimiento. Se puede concluir entonces, que antes de empezar el proceso de análisis y modelamiento de los datos para crear mecanismos de Minería de Datos, se deben tener en cuenta los siguientes aspectos: (i) la ubicación de los datos, (ii) los campos disponibles (variables), y (iii) los permisos para el acceso a la bodega de datos. Con respecto a la ubicación de los datos se puede afirmar que, en el caso específico de las tarjetas de crédito, los tarjetahabientes de la entidad y las transacciones declinadas por fondos insuficientes, la ubicación de la información es el aplicativo FACT del sistema de información AS400 y el sistema de información BUK. En relación con los campos o variables disponibles, en el Anexo C del presente documento se presenta un resumen de las variables que están disponibles en la bodega de datos del Banco Davivienda S.A., y que se relacionan directamente con el caso de estudio. Por último, cabe destacar que una vez se hayan validado cada uno de los aspectos anteriormente mencionados, se debe formalizar el requerimiento de información, y bien sea el caso, descargar la información directamente de la bodega de datos, o enviar el requerimiento a un área con acceso permitido a la bodega de datos, para que descargue la información. La consolidación de la información en herramientas de Microsoft Office (Excel y/o Access), el tratamiento de los datos y la generación de conocimiento para la toma de decisiones, dependen directamente del objetivo del proyecto y del personal encargado de éste. 47 4. DICCIONARIO DE DATOS Con el fin de presentar y explicar las variables que se extrajeron del almacén de datos del Banco Davivienda S.A. para desarrollar el mecanismo de Minería de Datos que permita analizar la valoración y otorgamiento de extra cupos dentro de la entidad, a continuación se presenta la descripción de la metodología utilizada para seleccionar las variables, la descripción del procedimiento que se llevó a cabo para la obtención de esta información y la descripción de los campos obtenidos. 4.1. GENERALIDADES Teniendo en cuenta el objetivo general del presente trabajo de grado8 y la información disponible en la bodega de datos, se realizó el análisis de las variables que describen el proceso de valoración y otorgamiento de extra cupos dentro del Banco Davivienda S.A., y que podrían ser relevantes para incluirlas en el proceso de generación del mecanismo de Minería de Datos. Se identificó que la muestra de datos seleccionada debía cumplir con el objetivo de describir las transacciones realizadas por alguno de los canales habilitados por la entidad, y que dichas transacciones debían haber sido declinadas por fondos insuficientes. El gráfico 13 ilustra la muestra de datos de interés para el desarrollo del presente trabajo de grado. Gráfico 13. Muestra de datos extraídos del Almacén de Datos. Fuente: La autora De acuerdo con lo anterior, la información recopilada cumplió con las siguientes características: • Se obtuvo una muestra de las transacciones declinadas por fondos insuficientes para el período de un año. Transacciones declinadas entre junio de 2010 y junio de 2011. Objetivo General: Determinar un mecanismo basado en Minería de Datos que permita hacer eficiente la autorización ocasional de transacciones o extra cupos a los tarjetahabientes del Banco Davivienda S.A. 8 48 4.2. • La muestra sólo incluyó las transacciones realizadas bajo la modalidad de compra. Esto incluye transacciones registradas a través de POS, ya sean presenciales (datafono) o no presenciales (compras por Internet). • Se incluyeron las transacciones realizadas con tarjetas de todas las franquicias: Visa, MasterCard, Diners y Marcas Compartidas. • Se tomó en cuenta el total de tarjetas de crédito vigentes a Julio de 2011. • Para los clientes que tienen tarjetas de crédito bajo la modalidad de amparadas se tomó como cliente al amparador, y para las tarjetas de crédito bajo la modalidad de extendidas se tomó como cliente al dueño de la tarjeta principal. De esta forma, el número total de tarjetas de crédito por cliente hace referencia a las tarjetas que el cliente tiene como titular de las tarjetas propias y extendidas, y como amparador. METODOLOGÍA Como se había identificado con anterioridad, el área encargada del monitoreo y control de las tarjetas de crédito dentro del Banco Davivienda S.A. es el área de Monitoreo de Medios de Pago. Basados en esto, se pasó el requerimiento de información a dicha área, con el fin de obtener las transacciones declinadas por fondos insuficientes en el período determinado. El resultado obtenido fue una base de datos inicial con un total de 1.302.662 transacciones declinadas por este concepto. Posteriormente, a la Unidad de Inteligencia de Negocios de la Vicepresidencia de Medios de Pago se le hizo el requerimiento de información de los clientes con tarjetas de crédito vigentes a Julio de 2011. Se obtuvo una base de datos con 1.710.046 de tarjetas vigentes a la fecha de corte y la descripción detallada del producto en 92 campos. Una vez se tuvo esta información, se realizó el cruce por tarjeta de crédito de las dos bases originales, con el fin de obtener el número de clientes con tarjetas de crédito vigentes, que habían transado en el comercio y les habían sido declinadas sus transacciones por fondos insuficientes. Luego del cruce se obtuvo una base con 1.070.791 transacciones declinadas. Lo anterior implica que 231.871 transacciones de la base de datos original (18% de las transacciones) fueron realizadas con tarjetas de crédito que a la fecha de corte ya no están vigentes. Igualmente se identificó que existe un total de 195.018 clientes con transacciones declinadas por fondos insuficientes en el período analizado, y un total de 259.876 tarjetas de crédito asociadas a estas declinaciones. En promedio se declinaron 5 transacciones por cliente. 49 La tabla 5 muestra la descripción de los campos de la base de datos inicial de las transacciones declinadas por fondos insuficientes. NOMBRE NO. DE TARJETA RED LÓGICA ALMACÉN DESCRIPCIÓN DEL CAMPO / VARIABLE Contiene los 16 dígitos del número de la tarjeta de crédito. Para las tarjetas de crédito: • Visa: 16 dígitos que comienzan en 4. • MasterCard: 16 dígitos que comienzan en 5. • Diners / Marcas Compartidas: 16 dígitos que comienzan con 0036. Contiene la información de la red por la que se registró la transacción. Longitud 4. • VSI: Visa Internacional. • MCI: MasterCard Internacional. • DAVI: Diners Nacional. • ASCR: Credibanco Visa. • PRO1: Redeban Multicolor. • DCI: Diners Internacional. TIPO DE VARIABLE Texto. Texto. Contiene el número de identificación del comercio a través del cual se realizó la transacción. Longitud 10. Texto. FECHA TRX Contiene la fecha de transacción. Cadena de 8 dígitos. Primero se identifica el año, luego el mes y finalmente el día. Ejemplo: 01 de enero de 2011. “20110101”. Texto. HORA TRX Contiene la hora de la transacción. Cadena de 8 dígitos. Primero se identifica la hora, luego los minutos, los segundos y finalmente los milisegundos. Ejemplo: 13:40:22:00 “13402200”. Texto. NOMBRE DEL ALMACÉN Contiene la cadena de caracteres asociada al código del almacén donde se realizó la transacción. Longitud 22. Texto. TIPO TRX Contiene una cadena de 2 dígitos que indica el tipo de transacción realizada. • Para transacciones de compras: 10 Texto. DISPOSITIVO Contiene el indicador del dispositivo por el cual se registró la transacción. • P: Transacciones de compra a través de datafono o canal de internet. Texto. Contiene el valor total de la transacción realizada. Doble. Indica la causa del rechazo de la transacción. Longitud 4. • 8348: Declinación por fondos insuficientes. Texto. CÓDIGO ALMACÉN MONTO CÓDIGO RECHAZO 50 POS ENTRY MODE Cadena de dos dígitos que indica el dispositivo electrónico que recibió la transacción. • 00 – 01: Transacciones no presenciales. A través de internet. • 02: Tarjeta con banda magnética. • 05: Tarjeta con chip. • 82 – 80: Código de validación entre el datafono y el chip y la tarjeta de crédito. Texto. Tabla 5. Diccionario de datos de la base inicial de transacciones declinadas por fondos insuficientes Fuente: La autora. Adicionalmente, la tabla 6 presenta la descripción de algunos de los campos de la base de datos correspondiente a las tarjetas de crédito vigentes a julio de 2011. NOMBRE DESCRIPCIÓN DEL CAMPO TIPO DE VARIABLE Contiene los 16 dígitos del número de la tarjeta de crédito. Para las tarjetas de crédito: • Visa: 16 dígitos que comienzan en 4. • MasterCard: 16 dígitos que comienzan en 5. • Diners / Marcas Compartidas:14 dígitos que comienzan con 36 Texto. Indica el tipo de identificación del cliente: • 1: Cédula de ciudadanía. • 2: Cédula de extranjería. • 3: N.I.T. • 4: Tarjeta de identidad. • 5: Pasaporte. Texto. FECHA ACTIVACIÓN Contiene la fecha de activación del producto. Cadena de 8 dígitos. Primero se identifica el año, luego el mes y finalmente el día. Ejemplo: 01 de enero de 2011. “20110101”. Texto. TIPO TARJETA Contiene la descripción del tipo de tarjeta otorgada al cliente. Letra que identifica el tipo de tarjeta. • A: Amparada. • E: Extendida. • P: Principal. Texto. FECHA 1ª COMPRA Contiene la fecha de la primera compra que se realizó con el producto. Cadena de 8 dígitos. Primero se identifica el año, luego el mes y finalmente el día. Ejemplo: 01 de enero de 2011. “20110101”. Texto. VALOR 1A COMPRA Contiene el valor total de la primera compra realizada con el producto. Doble. NO. DE TARJETA TIPO IDENTIFICACIÓN 51 FECHA 1ª AVANCE Contiene la fecha del primer avance que se realizó con el producto. Cadena de 8 dígitos. Primero se identifica el año, luego el mes y finalmente el día. Ejemplo: 01 de enero de 2011. “20110101”. Texto. VALOR 1ª AVANCE Contiene el valor total del primer avance realizado con el producto. Doble. CUPO APROBADO Cupo máximo otorgado con el producto. Doble. CALIFICACIÓN DEFINITIVA Calificación de riesgo. Letra que identifica la calificación final de riesgo del cliente (riesgo de incumplimiento): • A: Normal. • B: Aceptable. • C: Apreciables. • D: Significativo. • E: Incobrable. Texto. NRO REESTRUCTURACIONES Contiene el número total de reestructuraciones que ha tenido el cliente, desde que se le activo el producto hasta la fecha de corte. Entero largo. NRO CUOTAS MORA Contiene el número total de cuotas (mensuales) en las que el cliente no ha cumplido con sus pagos oportunos. Entero largo. NRO FACTURAS GENERADAS Contiene el número total de facturas generadas al cliente, desde el momento de activación del producto hasta la fecha de corte. Entero largo. CUPO DISPONIBLE Indica el monto total disponible del producto en el período de corte (mensual). Doble. VALOR COMPRAS MES Contiene el monto total de las transacciones realizadas bajo la modalidad de compra en el mes (fecha de corte). Doble. SALDO COMPRAS Contiene el monto total de saldo del producto por concepto de compras. Doble. VALOR AVANCES MES Contiene el monto total de las transacciones realizadas bajo la modalidad de avance en el mes (fecha de corte). Doble. PAGO MÍNIMO Indica el pago que el cliente debe realizar a la fecha de corte, por las utilizaciones del mes. Doble. PAGO TOTAL Indica el monto total a pagar. Es la suma del monto total de las transacciones realizadas por el cliente hasta la fecha de corte. Doble. Indica el monto total generado por intereses en el mes analizado. Doble. Indica el monto total generado por interés de mora en el mes analizado. Doble. INTERÉS FACTURADO MES MORA FACTURADA MES Tabla 6. Diccionario de datos de la base inicial de tarjetas de crédito vigentes a julio de 2011. Fuente: La autora. 52 Finalmente, la tabla 7 contiene la descripción de la información demográfica de los clientes que han presentado transacciones declinadas por fondos insuficientes. NOMBRE NRO. DE IDENTIFICACIÓN DESCRIPCIÓN DEL CAMPO TIPO DE VARIABLE Número de que identifica al cliente. Texto. EDAD Indica la edad del cliente en años. Número entre 16 y 99. Texto. SEXO Indica el género del cliente. • F: Femenino. • M: Masculino. • E: Empresas. • 0: No posee información. Texto. Indica la actividad a la que se dedica el cliente la mayor parte de su tiempo. • A: Ama de casa. • D: Servidor público. • E: Empleado. • I: Independiente. • P: Pensionado. • R: Religioso. • S: Socio. • T: Estudiante • SI: Empresas y sin información. Texto. Estado civil del cliente. • 0: Sin información. • 1: Soltero. • 2: Casado. • 3: Separado. • 4: Viudo. • 5: Divorciado. • 6: Unión libre. • 7: Religioso. • SI: Empresas. Texto. OCUPACIÓN ESTADO CÍVIL Tabla 7. Diccionario de datos de la base demográfica del cliente. Fuente: La autora. Una vez se consolidó la base de datos con la información de las transacciones declinadas por fondos insuficientes, las tarjetas de crédito vigentes a la fecha de corte y los datos demográficos, se procedió a realizar la limpieza y codificación de las base de datos, con el fin de identificar patrones potenciales que permitan describir el comportamiento de los clientes a los que se les ha declinado alguna transacción por fondos insuficientes, teniendo en cuenta los siguientes parámetros: 53 1. La base original codificaba los números de tarjeta de crédito con 19 dígitos. El número de las tarjetas de crédito debe contener 16 dígitos9. Para codificar la nueva base se debieron eliminar los tres primeros “0” de cada una de las identificaciones de las tarjetas de crédito. 2. El campo “RED LOGICA ALMACEN” identifica la red por la cual las transacciones han sido registradas. Para facilitar el manejo de esta información se codificó el campo de la siguiente manera: 11: Visa Internacional, 12: MasterCard Internacional, 13: Diners Internacional, 21: Visa Nacional, 22: MasterCard Nacional, 23: Diners Nacional. 3. Para simplificar la información relacionada con el almacén donde se registró la declinación de la transacción, se cruzó la base de datos por nombre y código del establecimiento con una base única de códigos de establecimientos agrupados, conocida como MCC10. Es importante destacar que del total de las transacciones declinadas por fondos insuficientes, 217.317 transacciones no cuentan con información del establecimiento, esto implica que la base final tan sólo cuenta con el 80% de la información de los MCC. 4. Con respecto a la hora en la que se registró la declinación, se codificó la información de la siguiente manera: M: Mañana. Horario comprendido entre las 6:00 y las 12:00, T: Tarde. Horario comprendido entre las 13:00 y las 18:00, N: Noche. Horario comprendido entre las 19:00 y las 5:00. 5. La fecha de declinación de la transacción fue codificada en dos grupos diferentes: (i) Día de la semana y (ii) Mes. Con respecto al día de la semana, se obtuvo el día en que se realizó la transacción: 1: Domingo, 2: Lunes, 3: Martes, 4: Miércoles, 5: Jueves, 6: Viernes, 7: Sábado. Con respecto al mes, se obtuvo el mes en el que se realizó la transacción: 1: Enero, 2: Febrero, 3: Marzo, 4: Abril, 5: Mayo, 6: Junio, 7: Julio, 8: Agosto, 9: Septiembre, 10: Octubre, 11: Noviembre, 12: Diciembre. 6. El monto de la declinación se dividió entre 1.000 para obtener los valores adecuados de las transacciones declinadas por fondos insuficientes11. 7. Los campos TIPO TRX, DISPOSITIVO, CÓDIGO DE RECHAZO y POS ENTRY MODE no se tuvieron en cuenta, ya que se consideró que no eran relevantes para describir el proceso de valoración y otorgamiento de extra cupos. 8. La información relacionada con avances no se incluye en el análisis, ya que en la base de datos de declinaciones sólo se cuenta con información de transacciones realizadas bajo la modalidad de compra. 9. De la base de tarjetas de crédito vigentes a julio de 2011 las variables: TIPO DE IDENTIFICACIÓN, TIPO DE TARJETA, VALOR 1ª COMPRA, FECHA 1ª AVANCE, VALOR 1ª AVANCE, NRO Esto con el fin de estandarizar las bases originales para poder realizar cruces a través de este campo. La descripción de la base total de los MCC se encuentra disponible en el Anexo D del presente trabajo de grado. 11 Las bases de datos presentan variabilidad en la codificación de la información. Esto se debe principalmente a la forma como se busca y descarga la información del almacén de datos (consultas) y la constitución de las bases de datos en archivos de Microsoft Excel y/o Microsoft Access. 9 10 54 REESTRUCTURACIONES, NRO CUOTAS MORA, SALDO COMPRAS, VALOR AVANCES MES, no se tuvieron en cuenta ya que se consideró que no eran relevantes para describir el proceso de valoración y otorgamiento de extra cupos. 10. Se hizo el cálculo de la diferencia la fecha de corte y la fecha de la última transacción para identificar los clientes con transacciones más recientes. 11. Se calculó la suma total de los intereses generado por el cliente (corrientes y mora) y se dividió en el total de años que el cliente tiene su tarjeta de crédito con el Banco, con el fin de identificar el total de intereses anuales generados. 12. Se calculó la relación entre el valor declinado y el cupo total asignado en todas las tarjetas de crédito del cliente. 13. Se agruparon las edades en siete grupos: (i) edades entre 16 y 18, (ii) edades entre 19 y 25, (iii) edades entre 26 y 35, (iv) edades entre 36 y 55, (v) edades entre 56 y 70, (vi) edades entre mayores de 70 años, y (vii) Sin información y empresas. 14. Las bases de datos disponibles fueron agrupadas por cliente. Se eliminaron las identificaciones de los clientes y de las tarjetas de crédito, y se reemplazó está información con una identificación aleatoria (números entre 1 y 195.018)12. 4.3. VARIABLES INICIALES Después de haber limpiado y codificado las bases de datos iniciales, se obtuvo la agrupación de los datos con los campos anteriormente mencionados. En primera medida, se obtuvo una base agrupada por cliente, compuesta por un total de 195.018 clientes; adicionalmente una base de datos agrupada por MCC, con un total de 112 establecimientos; una base de datos con información del producto de tarjeta de crédito, con un total de 259.876 tarjetas de crédito (agrupada en los 195.018 clientes) y una base con la demografía y segmentación de los clientes a los que les fueron declinadas sus transacciones por fondos insuficientes. A continuación se presenta la estructura de cada una de las bases obtenidas. • Base agrupada por cliente La base agrupada por cliente cuenta con los siguientes campos. La no identificación de las bases de datos, tanto de números de identificación de los clientes como de números de tarjetas de crédito de los mismos, se hizo necesaria para el manejo de la confidencialidad de la información suministrada por el Banco Davivienda S.A. 12 55 NOMBRE CLIENTE TIPO IDENTIFICACIÓN CALIFICACIÓN NRO. DE TRANSACCIONES DECLINADAS TOTAL DECLINADO % EXTRA CUPO FRANQUICIA MÁS FRECUENTE DESCRIPCIÓN DEL CAMPO Número que identifica al cliente. Aleatorio entre 1 y 195.018. Indica el tipo de identificación del cliente Indica la calificación final de riesgo de cada cliente. (A, B, C, D, E). Total de transacciones por cliente, declinadas por fondos insuficientes en el período comprendido entre junio de 2010 y junio de 2011. Suma del monto de todas las transacciones declinadas del cliente. Porcentaje del extra cupo declinado. Relación entre el monto declinado el cupo total asignado. Moda de la franquicia. %VISA NAL Porcentaje de transacciones registradas a través de la red Credibanco Visa. %VISA INTERNAL Porcentaje de transacciones registradas a través de la red Visa Internacional. %MASTER NAL Porcentaje de transacciones registradas a través de Redeban Multicolor. %DINERS NAL Porcentaje de transacciones registradas a través de la red MasterCard Internacional. Porcentaje de transacciones registradas a través de la red Diners Nacional. % DINERS INTERNAL Porcentaje de transacciones registradas a través de la red Diners Internacional. %MASTER INTERNAL TIPO DE TRX MÁS FRECUENTE % NAL %INTERNAL HORA FRECUENTE Moda de transacción. Porcentaje de transacciones nacionales. Porcentaje de transacciones internacionales. Moda de hora. %M Porcentaje de transacciones realizadas en la mañana. %T Porcentaje de transacciones realizadas en la tarde. %N Porcentaje de transacciones realizadas en la noche. DÍA FRECUENTE %DOMINGO Moda de día. Porcentaje de transacciones realizadas el domingo. %LUNES Porcentaje de transacciones realizadas el lunes. %MARTES Porcentaje de transacciones realizadas el martes. %MIÉRCOLES Porcentaje de transacciones realizadas el miércoles. %JUEVES Porcentaje de transacciones realizadas el jueves. %VIERNES Porcentaje de transacciones realizadas el viernes. %SÁBADO Porcentaje de transacciones realizadas el sábado. MES FRECUENTE Moda de mes. 56 %ENERO Porcentaje de transacciones realizadas en enero. %FEBRERO Porcentaje de transacciones realizadas en febrero. $MARZO Porcentaje de transacciones realizadas en marzo. %ABRIL Porcentaje de transacciones realizadas en abril. %MAYO Porcentaje de transacciones realizadas en mayo. %JUNIO Porcentaje de transacciones realizadas en junio. %JULIO Porcentaje de transacciones realizadas en julio. Porcentaje de transacciones realizadas en agosto. %AGOSTO %SEPTIEMBRE Porcentaje de transacciones realizadas en septiembre. Porcentaje de transacciones realizadas en octubre. %OCTUBRE %NOVIEMBRE Porcentaje de transacciones realizadas en noviembre. %DICIEMBRE Porcentaje de transacciones realizadas en diciembre. MONTO PROMEDIO Promedio del total declinado por fondos insuficientes. MONTO MÁXIMO Monto máximo registrado por cliente. MONTO MÍNIMO Monto mínimo registrado por cliente. DESVIACIÓN ESTÁNDAR MONTO Desviación estándar de los montos registrados por cliente. VARIANZA MONTO Varianza de los montos registrados por cliente. MCC FRECUENTE Moda del establecimiento. Tabla 8. Diccionario de datos de la base agrupada por cliente. Fuente: La autora. • Base agrupada por MCC La base agrupada por MCC cuenta con los siguientes campos. NOMBRE MCC NRO. DE TRANSACCIONES DECLINADAS TOTAL DECLINADO FRANQUICIA MÁS FRECUENTE DESCRIPCIÓN DEL CAMPO Código de MCC. Total de transacciones por cliente, declinadas por fondos insuficientes en el período comprendido entre junio de 2010 y junio de 2011. Suma del monto de todas las transacciones declinadas por MCC. Moda de la franquicia. 57 %VISA NAL Porcentaje de transacciones registradas a través de la red Credibanco Visa. %VISA INTERNAL Porcentaje de transacciones registradas a través de la red Visa Internacional. %MASTER NAL %MASTER INTERNAL %DINERS NAL % DINERS INTERNAL TIPO DE TRX MÁS FRECUENTE % NAL %INTERNAL HORA FRECUENTE Porcentaje de transacciones registradas a través de Redeban Multicolor. Porcentaje de transacciones registradas a través de la red MasterCard Internacional. Porcentaje de transacciones registradas a través de la red Diners Nacional. Porcentaje de transacciones registradas a través de la red Diners Internacional. Moda de transacción. Porcentaje de transacciones nacionales. Porcentaje de transacciones internacionales. Moda de hora. %M Porcentaje de transacciones realizadas en la mañana. %T Porcentaje de transacciones realizadas en la tarde. %N Porcentaje de transacciones realizadas en la noche. DÍA FRECUENTE %DOMINGO Moda de día. Porcentaje de transacciones realizadas el domingo. %LUNES Porcentaje de transacciones realizadas el lunes. %MARTES Porcentaje de transacciones realizadas el martes. %MIÉRCOLES Porcentaje de transacciones realizadas el miércoles. %JUEVES Porcentaje de transacciones realizadas el jueves. %VIERNES Porcentaje de transacciones realizadas el viernes. %SÁBADO Porcentaje de transacciones realizadas el sábado. MES FRECUENTE Moda de mes. %ENERO Porcentaje de transacciones realizadas en enero. %FEBRERO Porcentaje de transacciones realizadas en febrero. $MARZO Porcentaje de transacciones realizadas en marzo. %ABRIL Porcentaje de transacciones realizadas en abril. %MAYO Porcentaje de transacciones realizadas en mayo. %JUNIO Porcentaje de transacciones realizadas en junio. 58 Porcentaje de transacciones realizadas en julio. %JULIO Porcentaje de transacciones realizadas en agosto. %AGOSTO Porcentaje de transacciones realizadas en septiembre. %SEPTIEMBRE Porcentaje de transacciones realizadas en octubre. %OCTUBRE %NOVIEMBRE Porcentaje de transacciones realizadas en noviembre. %DICIEMBRE Porcentaje de transacciones realizadas en diciembre. MONTO PROMEDIO Promedio del total declinado por fondos insuficientes. MONTO MÁXIMO Monto máximo registrado por MCC. MONTO MÍNIMO Monto mínimo registrado por MCC. DESVIACIÓN ESTÁNDAR MONTO VARIANZA MONTO Desviación estándar de los montos registrados por MCC. Varianza de los montos registrados por MCC. Tabla 9. Diccionario de datos de la base agrupada por MCC. Fuente: La autora. • Base con información del producto de tarjeta de crédito por cliente. La base agrupada por tarjeta de crédito cuenta con los siguientes campos. NOMBRE CLIENTE DESCRIPCIÓN DEL CAMPO Número que identifica al cliente. Aleatorio entre 1 y 195.018. EDAD DEL PRODUCTO Edad del cliente con el producto de tarjeta de crédito. Indica la edad de la tarjeta más antigua (en el caso de tener varias tarjetas). RECENCY Diferencia entre la última fecha de transacción y la fecha de corte. Indica las transacciones más recientes. ANTIQUITY Total de facturas mensuales generadas por el cliente en todas sus tarjetas de crédito (Máximo valor). MONETIZE Cociente entre la suma de los intereses generados entre el número total de facturas generadas. Tabla 10. Diccionario de datos de la base agrupada por tarjeta de crédito. Fuente: La autora. Finalmente la base demográfica no tuvo ninguna modificación, pues todos sus campos están compuestos por variables nominales. 59 4.4. VARIABLES SELECCIONADAS Una vez se consolidaron las bases de datos con la información relevante del proceso, se procedió a realizar el análisis estadístico de cada una de las variables iniciales. Este análisis permitió determinar qué variables eran relevantes para incluir en el modelo final, de acuerdo con su comportamiento estadístico. Todo el estudio estadístico se realizó con la ayuda del software PASW 18.0. El análisis consistió en examinar por separado cada una de las bases de datos iniciales con sus respectivas variables, con el fin de aplicar las herramientas necesarias para preparar y reducir de manera apropiada los datos y las variables encontradas, que posteriormente se introducirán en el modelo de Minería de Datos. El procedimiento que se llevó a cabo se ilustra a continuación en el gráfico 14. Gráfico 14. Proceso para la selección de variables iniciales.13 Fuente: La autora Los resultados que arrojó el proceso se listan a continuación. • Análisis previo de los datos: De las bases originales, cada una con 195.018 clientes, se identificó que se presentaban algunos datos sin información en las variables: MCC, género ocupación y estado civil, sin embargo se caracterizaron dentro de una categoría y se consideró 13 En los anexos E al G del presente documento se encuentra disponible el proceso para la selección de las variables iniciales. El anexo E comprende el análisis previo de los datos, el anexo F describe el proceso de transformación de las variables y el anexo G presenta el análisis factorial. 60 que no son críticas para el análisis de clúster. Con respecto a los casos atípicos, la base final agrupada por cliente presenta 1.508 casos anómalos, lo que corresponde a menos del uno por ciento de la base total. La base con información RAM, después del análisis previo de los datos, presentó 9.571 casos anómalos, lo que representa el cinco por ciento de la base total. Las bases con variables nominales no presentaron ningún caso anómalo. Adicionalmente, revisando los supuestos del análisis multivariante (normalidad, linealidad y homocedasticidad) en cada una de las bases disponibles, se encontró que: 1. La base final agrupada por cliente, con 38 variables disponibles, presenta un comportamiento leptocúrtico en el 89,47% de sus variables y un comportamiento platicúrtico en el 10,53% de sus variables; con respecto a la simetría de las distribuciones, presenta asimetría positiva en el 92,10% de sus variables y asimetría negativa en el 7,9%. 2. La base con información del producto de tarjeta de crédito por cliente, con tres variables disponibles, presenta un comportamiento leptocúrtico en dos de sus variables y un comportamiento platicúrtico en una variable; con respecto a la simetría de las distribuciones, presenta asimetría positiva en sus tres variables. 3. Las variables nominales presentan la siguiente distribución porcentual: (i) Calificación: A (89,2%), B (6,2%), C (2,1%), D (1,8%) y E (0,7%); (ii) MCC: supermercados / tiendas express (19,2%), almacenes por departamento con supermercado (12,8%), almacenes de calzado (9,3%), almacenes de vestuario y accesorios para toda la famila (7,1%), estaciones de servicio, aerolineas (5,65); (iii) Edad: 16-18 (0%), 19-25 (6,4%), 25-35 (30,1%), 36-55 (50%), 56-70 (11,9%), >70 (1,3%) y empresas (0,3%); (iv) Género: femenino (50,7%), masculino (49 %) y empresas (0,3%); (v) Estado civil: sin información (8,65), soltero (34%), casado (37,2%), separado (3,2%), viudo (1,5%), divorciado (1,6%), unión libre (13,6%), religioso (0%) y empesas (0,3%); (vi) Ocupación: ama de casa (0,9%), servidor público (0,1%), empleado (64,8%), independiente (26%), pensionado (2,7%), religioso (0%), socio (0,2%), empresas y sin información (4,6%), estudiante (0,7%). • Transformación de las variables iniciales: Dados estos comportamientos se hace necesario transformar las variables con el fin de disminuir la curtosis y la asimetría de las variables escalares. Como la mayoría de las variables presentaban un comportamiento leptocúrtico y asimétrico positivo, se llevó a cabo la transformación de logaritmo en base 10 [log( + 1)] de cada una de las variables. Se obtuvo los siguientes resultados: 1. La base final agrupada por cliente, presenta después de la transformación una disminución significativa en los valores de las curtosis y las asimetrías de todas sus variables. Los comportamientos leptocúrticos se presentan en el 36,84% de sus variables y los comportamientos platicúrticos se presentan en el 63,16% de sus variables. Lo anterior 61 implica que hubo una variación de 52,63 puntos porcentuales; con respecto a la simetría de las distribuciones, ahora presenta asimetría positiva en el 63,15% de sus variables y asimetría negativa en el 36,85%, lo que implica una variación de 28,95 puntos porcentuales. Lo anterior es un buen indicador ya que asegura que las variables no tienen valores extremos y se facilita el análisis de los conglomerados. 2. La base con información del producto de tarjeta de crédito por cliente después de la transformación no presenta comportamiento leptocúrtico en ninguna de sus variables, es decir, ahora todas sus variables presentan un comportamiento platicúrtico; con respecto a la simetría de las distribuciones, presenta asimetría positiva en sus tres variables. 3. Las variables nominales no fueron transformadas. Una vez se han transformado las variables se procede a estandarizarlas para asegurar que los valores incluidos en cada una de éstas están siendo homogéneos, es decir, se está removiendo la escala de cada una de las variables. 1. Análisis factorial: Se realizó el análisis factorial por componentes principales. Se pudo concluir que aunque no fue posible una gran reducción de variables a factores, dado que el grafico de sedimentación resultante sugería doce factores, sí fue posible eliminar del análisis las variables: Monto Total Declinado, Monto Mínimo, Monto Máximo, % Visa Internacional y % Master Internacional, y las variables que podían generar redundancia y multicolinealidad: % Diners Nacional, % Diners Internacional, % Transacciones Internacionales, % Noche, % Domingo, y % Enero. Al final se seleccionaron 26 variables escalares y seis variables nominales. Las tres variables RAM fueron incluidas en su totalidad. 4.4.1. Criterios para la selección de variables Una vez finalizado este proceso se procedió a seleccionar las variables que se ingresarían en el mecanismo de Minería de Datos para analizar el proceso de valoración y otorgamiento de extra cupos. Los criterios que se tuvieron en cuenta se listan a continuación. 1. Seleccionar la base de datos que contiene mayor información y describe de mejor manera el proceso de declinación de transacciones por fondos insuficientes. De acuerdo con esto se determinó que la base agrupada por MCC no se tendría en cuenta, ya que en la base agrupada por cliente se tiene un campo con la información cliente a cliente del establecimiento más frecuente de transacción. 2. Elegir las variables que realmente describen el proceso de valoración y otorgamiento de extra cupos. De la base agrupada por cliente se descartaron las variables que describían las frecuencias: (i) de 62 las franquicias (Franquicia más frecuente); (ii) de las horas (Hora más frecuente); (iii) de los días (Día más frecuente) y (iii) de los meses (Mes más frecuente). Se eliminaron estas variables ya que se encontró que en el proceso de codificación se había calculado la moda de las variables asociadas a éstas y se presentaban múltiples modas para un mismo cliente, por lo que se consideró que no correspondía de manera adecuada a lo que se quería describir en la variable. 3. Seleccionar las variables que después del análisis previo y la transformación inicial contienen la mayor información del total de las variables disponibles. Esto implica que se seleccionan las variables que representan de mejor manera la información contenida en otras variables. Para llevar a cabo este proceso se tiene en cuenta la matriz de correlaciones de los factores rotados del Análisis Factorial. Las variables de la base de datos agrupada por cliente que se eliminaron del análisis fueron: (i) Las que representan el monto total declinado: Total Declinado ($), Monto Mínimo, Monto Máximo, pues están representadas por las variables: Número de transacciones declinadas, Promedio de declinación ($) y Desviación estándar ($) y (ii) Las que representan transacciones internacionales: % Visa Internacional, % Master Internacional y % Diners Internacional, pues están representadas por las transacciones que se hacen a nivel nacional. 4. Seleccionar variables que además de describir el proceso de valoración y otorgamiento de extra cupos, puedan describir el comportamiento del cliente con su producto de tarjeta de crédito en el tiempo, así como las variables que describen la demografía del cliente. En conclusión se identificaron tres grupos de variables que describen al cliente: • Variables de comportamiento: Describen el comportamiento de los clientes que han registrado alguna transacción declinada por fondos insuficientes. • Variables de fidelidad con la entidad14: Teniendo en cuenta la idea de que “El 80% del negocio proviene del 20% de los clientes”, se encontraron las variables que describen la novedad de las transacciones, ¿qué tan recientes son las transacciones del cliente?, la antigüedad del cliente, ¿cuánto lleva el cliente con el Banco? y el beneficio económico asociado a las transacciones, ¿cuánto dinero genera el cliente con sus transacciones? • Variables demográficas: Describen las características más generales de los clientes. 14 Esta agrupación hace referencia al análisis RFM. 63 5. MECANISMO DE MINERÍA DE DATOS El siguiente paso en el análisis de la información disponible es emplear alguna herramienta de Minería de Datos para encontrar patrones escondidos, que permitan analizar, identificar y establecer parámetros en el comportamiento y las características de los clientes a los que se les han declinado sus transacciones por fondos insuficientes. Lo anterior con el fin de generar un mecanismo eficiente que facilite la toma de decisiones con respecto a los clientes a los que se les puede otorgar un extra cupo en alguna de sus tarjetas de crédito. A continuación se presenta la descripción del mecanismo de Minería de Datos empleado, el proceso llevado a cabo y los resultados obtenidos. 5.1. SELECCIÓN DEL MÉTODO A EMPLEAR Se ha identificado que la técnica de Minería de Datos que se va a utilizar para determinar una forma eficiente de valorar y otorgar extra cupos a los tarjetahabientes del Banco Davivienda S.A. es una técnica de aprendizaje no supervisado, específicamente un algoritmo de agrupamiento o clustering. No será necesaria la utilización de técnicas de aprendizaje supervisado, pues no se requiere de la predicción de algún comportamiento de los tarjetahabientes. El propósito general es encontrar grupos homogéneos de clientes que presenten características similares de acuerdo con su comportamiento con el producto de tarjeta de crédito (declinaciones por fondos insuficientes), su fidelidad con la entidad y su demografía, para posteriormente plantear políticas aplicables al proceso de valoración y otorgamiento de extra cupos, y permitir que algunos de los clientes a los que se les han declinado transacciones por fondos insuficientes con anterioridad, puedan acceder al beneficio de obtener extra cupos ocasionales. El mecanismo de Minería Datos que se propone, debe analizar al cliente desde la perspectiva de la relación que éste ha tenido con la entidad, basado en el modelo de gestión planteado por el CRM (por sus siglas en inglés, Costumer Relationship Management), permitiendo así que la decisión de la autorización transaccional no sólo se base en la calificación de riesgo y el tipo de producto, sino que también, haga uso de variables que describen al cliente como usuario de las tarjetas de crédito dentro del Banco Davivienda S.A. La idea general de la propuesta es que además de revisar el comportamiento crediticio del tarjetahabiente, el cual es una variable fundamental para comprender al cliente desde la perspectiva de su capacidad de pago, su probabilidad de incumplir con las obligaciones y el riesgo que genera financieramente a la entidad, se puedan aplicar términos como CLTV (por sus siglas en inglés, Costumer Lifetime Value) y RFM (por sus siglas en inglés, Recency, Frequency and Monetary Value), como método de premiación al cliente por su trayectoria dentro del Banco Davivienda S.A. Es así como la propuesta de Minería de Datos deberá tener en 64 cuenta conceptos como: fidelización y conocimiento del cliente, optimización de la relación con el cliente, mejoramiento de la imagen de la entidad, entre otros. 5.2. DESCRIPCIÓN DEL MÉTODO La técnica de agrupamiento por conglomerados o clustering consiste en segmentar una población heterogénea en un número de grupos o conglomerados homogéneos. Tiene como objetivo asignar unas variables o grupo de variables a un grupo homogéneo, asegurándose de que los objetos de un grupo sean similares entre ellos y se diferencien de los objetos incluidos en otros grupos. Los grupos son desconocidos en el momento en que se está desarrollando el algoritmo, lo que implica que no existan grupos predefinidos. El análisis de clúster permite descubrir asociaciones y estructuras en los datos que no son evidentes a priori, pero que pueden ser útiles en la generación de conocimiento. Los resultados del análisis de conglomerados contribuyen a: (i) la definición formal de esquemas de clasificación, tal como la taxonomía para un conjunto de objetos; (ii) la elaboración de modelos estadísticos como herramienta para describir conjuntos de datos; (iii) la asignación de nuevos individuos a las clases, para el diagnóstico e identificación de patrones, y (iv) muchas otras aplicaciones en Minería de Datos (Carbonell Asíns, 2011). “Se utiliza clustering cuando se desea aprovechar la información relativa a un conjunto de variables para clasificar a un grupo amplio de sujetos y objetos en subgrupos de máxima homogeneidad intergrupal y mayor heterogeneidad entre grupal. El análisis clúster no debe confundirse con el discriminante, ya que este último tiene por objeto explicar una clasificación establecida a priori mientras que el análisis clúster intenta, precisamente, generar esa clasificación a partir de un único grupo global”. (Curso de Introducción y Manejo Básico del SPSS). Existen dos métodos de clasificación de los conglomerados: (i) los métodos de clasificación jerárquicos y (ii) los métodos de clasificación no jerárquicos. En los métodos jerárquicos, la clasificación final tiene un número de grupos anidados, mientras que en los métodos no jerárquicos, no se presentan grupos finales anidados. Igualmente existen dos técnicas relacionadas a estos métodos de clasificación: (i) las acumulativas y (ii) las divisivas. En las técnicas acumulativas el punto de partida son las clases de objetos disponibles que se desean clasificar a medida que se va iterando, con el fin de agrupar las variables en clases de objetos con características similares. En las técnicas divisivas el punto de partida es la única clase formada por todas las variables y a medida que se va iterando, se van dividiendo los objetos en clases más pequeñas (Vicente Villardón). El proceso que se sigue consiste en analizar cinco pasos fundamentales. El primer paso es establecer qué datos o variables se van a tener en cuenta en cada uno de los casos. Esto implica que se deben analizar las variables que se van a incluir en el grupo, de acuerdo con los tipos de variables disponibles: escalares, categóricas o nominales. El segundo paso es elegir una medida de distancia entre los objetos a clasificar, los cuales serán los grupos o conglomerados iniciales. En este paso, el método más común para calcular la distancia entre los objetos es el Método de Ward, el cual consiste en agrupar las variables de acuerdo con la varianza que presentan conjuntamente. Igualmente es recomendable estandarizar las variables iniciales con 65 el fin de asegurar que todas están siendo medidas bajo parámetros homogéneos. El tercer paso consiste en ejecutar la agrupación con la ayuda de algún software estadístico y examinar los conglomerados que presenten características similares. El cuarto paso es eliminar los grupos que presenten características similares juntándolos en un nuevo grupo, se debe asegurar que cada grupo contenga más de dos elementos. El quinto paso sugiere que se recalculen las distancias entre los grupos hallados y repetir el procedimiento hasta que se tenga una solución clara que se adapte al propósito general del agrupamiento (Carbonell Asíns, 2011) En el gráfico 15 se ilustra el proceso anteriormente descrito. Gráfico 15. Proceso de análisis de conglomerados. Fuente: La autora Los algoritmos dependen del método utilizado para calcular la distancia entre grupos. El agrupamiento por conglomerados consiste en la iteración de reglas con el fin de optimizar la solución final, lo que implica que no exista una única clasificación correcta, es decir, diferentes métodos para el cálculo de las distancias entre grupos homogéneos, tienen como resultado diferentes agrupaciones. Por lo tanto, es importante analizar la matriz de distancias, tratando de minimizar las distancias entre elementos de un mismo grupo y maximizar las distancias entre grupos. Finalmente, para analizar los grupos obtenidos se cuenta con herramientas de visualización de los resultados tales como la matriz de distancias. Con ayuda de un software estadístico se puede obtener esta matriz de 66 resultados finales. Se debe analizar cada uno de los grupos encontrados con el fin de generar parámetros y políticas de interés al caso de estudio. 5.3. DESARROLLO DEL MODELO El desarrollo del modelo de agrupamiento por conglomerados para el presente trabajo de grado estuvo dividido en tres enfoques fundamentales: (i) el clúster para determinar comportamientos en los clientes que han presentado transacciones declinadas por fondos insuficientes, (ii) el clúster basado en RAM (por sus siglas en inglés, Recency, Antiquity, Monetize)15 para determinar grupos de clientes que aunque han presentado transacciones declinadas por fondos insuficientes, presentan un comportamiento reciente, tienen antigüedad con la entidad y generan valores monetarios interesantes en la utilización de sus tarjetas de crédito16 y (iii) la demografía de los clientes. Adicionalmente, se tuvo en cuenta las calificaciones de crédito y los MCC más frecuentes, para hacer un análisis más completo de las posibles políticas que pueden surgir para optimizar el proceso de valoración y otorgamiento de extra cupos dentro del Banco Davivienda S.A. Cabe destacar que el agrupamiento por conglomerados para cada uno de los enfoques fue desarrollado con la ayuda del software PASW 18.0. La técnica multivariante elegida fue el análisis de conglomerados de K medias, ya que permite mayor flexibilidad en algunos de los supuestos estadísticos (linealidad, normalidad, variables categóricas, etc.) y admite varios métodos de estimación de la matriz de distancias. Igualmente, a través de ésta se tiene la posibilidad de procesar un número ilimitado de casos, aunque sólo permita utilizar un método de aglomeración y requiera previamente el número de conglomerados que se desea obtener (Universidad Complutense de Madrid). 5.3.1. Definición de parámetros Hay dos tipos de parámetros que se deben tener en cuenta para desarrollar el modelo: (i) parámetros para la realización del modelo y (ii) parámetros para la caracterización de los clientes. A continuación se presenta la descripción de cada uno. • Parámetros para la realización del modelo RAM (Recency, Antiquity, Monetize) hace referencia a la adaptación, por parte de la autora, de la teoría del RFM (Recency, Frequency, Monetize) a la disponibilidad de la información del presente trabajo de grado. No se contó con información que contribuyera a calcular la frecuencia de las transacciones, por lo cual se decidió cambiar este parámetro por la antigüedad del cliente, ya que se considera una característica relevante de para determinar la fidelidad. 16 Teniendo en cuenta solamente los intereses generados por cada cliente en el tiempo. 15 67 Para el desarrollo del análisis de los conglomerados se tuvo en cuenta las siguientes condiciones: 1. Número de grupos: En primera medida es importante determinar cuántos grupos se quieren y se desean encontrar. Con respecto a esto se determinó que el número óptimo de grupos debía ser alrededor de diez, ya que se esperaba que éstos fueran suficientes para describir adecuadamente los comportamientos más relevantes de los tarjetahabientes. Sin embargo, se hizo el análisis de conglomerados de K medias para los casos entre cinco y quince grupos predeterminados, y se concluyó que el número adecuado de grupos era ocho. Esta decisión estuvo basada en tres criterios principales: (i) el número de grupos no presente un crecimiento desproporcionado al combinarlo con las variables RAM y las variables demográficas, (ii) al analizar cualitativamente el significado de los grupos, se encontró que la solución de ocho conglomerados permitía identificar grupos de clientes interesantes para el negocio, con soluciones similares a las encontradas con mayor cantidad de grupos, y (iii) basado en el análisis de varianza se determina sí existe diferencia significativa entre el número de conglomerados y la distancia entre cada caso al centro del clúster.17 2. Número máximo de iteraciones: Se determinó que el límite de iteraciones fuera 100, con el fin de asegurar que transcurridas todas las iteraciones se consiguiera la convergencia. 3. Criterio de convergencia: Representa la proporción de la distancia mínima existente entre los centros iniciales de los conglomerados. Se estipuló que el valor de convergencia debía ser del 0%. Lo anterior permite asegurar que en la última iteración del algoritmo de agrupamiento por conglomerado de K medias, todos los centros se han desplazado lo suficiente como para asegurar que ninguna de las distancias entre ellos es mayor al 0%, es decir, todos han convergido (Universidad Complutense de Madrid). 4. Conglomerado de pertenencia: El conglomerado de pertenencia indica el grupo al que pertenece un determinado cliente (Ibídem, p. 67). Se guardan estos valores en una nueva variable (qcl_1)18 para permitir análisis posteriores. 5. Distancia desde el centro del conglomerado: La distancia desde el centro del conglomerado corresponde a la distancia euclídea existente entre cada caso y el centro del conglomerado al que pertenece (Ibídem, p. 67). Igualmente, se guardan estos valores en una nueva variable (qcl_2) para permitir análisis posteriores. 6. Tabla de contingencia: Una vez identificados los conglomerados, se agrupan cada una de las variables nominales disponibles en alguno de éstos con el fin de identificar la distribución de estas características en cada uno de los grupos analizados. Se obtiene la tabla con los recuentos por cada grupo y cada variable, y los residuos tipificados. En el Anexo H está disponible el análisis de varianza ANOVA de un factor que se llevo a cabo para la selección del número de grupos escogidos. 18 La numeración de las variables “qcl_#” va aumentando de acuerdo con el número de análisis de conglomerados de K medias que se ejecuten. Para un solo análisis se crearán dos variables: qcl_1 y qcl_2, correspondientes al conglomerado de pertenencia y la distancia desde el centro del conglomerado, respectivamente. 17 68 Una vez determinadas las condiciones, se procede a realizar el agrupamiento por conglomerados de K medias con la ayuda del software PASW 18.0. Los resultados a analizar son: los centros de conglomerados finales, el número de casos en cada conglomerado y los residuos tipificados de cada una de las tablas de contingencia. • Parámetros para la caracterización de los clientes Para caracterizar los patrones encontrados a través de los conglomerados se deben considerar los siguientes parámetros: 1. En la tabla de los centros finales por conglomerado, se buscan las variables que tengan mayores valores por grupo, y los grupos que tengan mayores valores por variable. Lo anterior implica que el análisis se debe centrar en encontrar los valores absolutos máximos, tanto por filas como por columnas. Estos valores indican los comportamientos sobresalientes por variables y por grupos. Sí el valor más alto encontrado por conglomerado es negativo, indica que esa variable no es preferente para ese grupo, e igualmente, sí el valor más alto encontrado por conglomerado es positivo, indica la preferencia de esa variable en el grupo. 2. Las tablas de casos por conglomerados dan una idea de la distribución de la población en cada uno de los grupos encontrados. 3. Las tablas de contingencia indican el comportamiento de la variable nominal con respecto a cada uno de los grupos encontrados. Se deben tener en cuenta los residuos tipificados de cada variable en cada conglomerado. Se buscan los valores más altos, positivos o negativos, y se comparan contra el valor |5,00|, para determinar la relevancia de cada una de las variables en cada uno de los grupos. 4. Se debe tener en cuenta que en la variable “Recency” el calificativo B indica que las transacciones han sido recientes, y el calificativo A que las transacciones no han sido recientes. Igualmente, para las variables “Antiquity” y “Monetize” los calificativos B indican antigüedad baja (cliente nuevo) y montos bajos, respectivamente, y los calificativos A indican mayor antigüedad y montos altos, respectivamente. 5.4. CARACTERIZACIÓN DE LOS CLIENTES A continuación se describe el desarrollo del agrupamiento por conglomerado de acuerdo con los dos enfoques propuestos19. En el anexo H se encuentran disponibles la tabla con los centros finales de los conglomerados y las tablas de contingencia de cada una de las variables estudiadas. 19 69 • Primer enfoque: Determinar el comportamiento de los clientes que han presentado transacciones declinadas por fondos insuficientes. El punto de partida para este enfoque es el conjunto de variables seleccionadas después de haber realizado el análisis factorial de la base de datos agrupada por cliente. A continuación se listan los resultados obtenidos. × Número de iteraciones ejecutadas y convergencia de los centros finales: Se logró la convergencia en la iteración número 56. Esto implica que se ha encontrado una solución no trivial y óptima en dicha iteración. × Centros de conglomerados finales: Teniendo como base la tabla de los centros de los conglomerados finales, se realizó el análisis de éstos y se encontraron las siguientes características. × • Conglomerado 1: Muchas transacciones internacionales, alta variabilidad en los montos declinados y porcentajes de extra cupos altos. • Conglomerado 2: No presenta parámetros relevantes. Se espera que en análisis de conglomerados de K medias se distinga un grupo que no presente características relevantes. A este conglomerado se le denomina “molde”, dado que en él están agrupados los clientes que no presentan comportamientos relevantes dentro de toda la población (Alvarado Valencia, 2011) • Conglomerado 3: Transacciones frecuentes en noviembre y no mucho en junio. • Conglomerado 4: Transacciones internacionales con porcentaje de extra cupos bajos y de no preferencia en la tarde. • Conglomerado 5: Transacciones frecuentes en marzo, abril, mayo con alta variabilidad en los motos declinados. • Conglomerado 6: Pocas transacciones declinadas y no variabilidad en los montos declinados. • Conglomerado 7: Muchas transacciones declinadas, porcentajes de extra cupos altos y alta variabilidad en los montos declinados. • Conglomerado 8: Transacciones internacionales con altos promedios de declinación. Número de clientes por conglomerado: Con respecto a la distribución de los clientes entre los conglomerados encontrados se puede afirmar que ninguno de ellos tiene muy pocos clientes (por ejemplo 10 o 20). Los grupos pequeños tienen una identificación clara de acuerdo a su perfil de 70 conglomerado lo que los hace nichos interesantes de mercado. El gráfico 16 presenta la distribución de los clientes por conglomerado. Gráfico 16. Número de clientes por conglomerado. Fuente: La autora. Por otro lado, para incluir en el análisis las variables nominales CALIFICACIÓN y MCC se analiza la tabla de contingencia resultante entre los grupos identificados con anterioridad y cada una de estas variables. A continuación se listan los resultados obtenidos. × Pruebas de chi cuadrado: Las tablas de contingencia resultantes entre los conglomerados iniciales y la calificación, y entre los conglomerados iniciales y los MCC, fueron significativas al nivel 5%. × Tablas de contingencias finales: Teniendo como base las tablas de contingencia, se realizó el análisis de éstos y se encontraron las siguientes características. • Conglomerado 1: Calificación más frecuente: A. Establecimientos comerciales más frecuentados: aerolíneas, compras en Internet, transporte de carga en general, almacenes de computadores y software, entidades financieras, hoteles y centros vacacionales, compañías de alquiler de vehículos y asociaciones profesionales y gremios. • Conglomerado 2: Calificación más frecuente: D y E. Establecimientos comerciales más frecuentados: Contratistas generales, residenciales y comerciales, almacenes por departamento sin supermercado, almacenes de misceláneas, cacharrerías y artículos para regalo, supermercados y tiendas exprés, almacén por departamento con supermercado, almacenes de vestuario y accesorios para toda la familia, droguerías, farmacias, tiendas naturistas, mercadeo directo, servicios de seguros, mercadeo directo, comerciantes de ventas telefónicas – DIRECTV y hoteles y centros vacacionales. 71 • • Conglomerado 3: Calificación más frecuente: C y D. Establecimientos comerciales más frecuentados: aerolíneas, almacenes por departamento sin supermercado y supermercados y tiendas exprés. • Conglomerado 4: Calificación más frecuente: A. Establecimientos comerciales más frecuentados: sin nombre, compras en Internet, almacenes de computadores y software, entidades financieras, compañías de alquiler de vehículos y asociaciones profesionales y gremios. • Conglomerado 5: Calificación más frecuente: A. Establecimientos comerciales más frecuentados: venta de equipos y servicios de telecomunicaciones, almacenes por departamento sin supermercado, supermercados y tiendas exprés, almacén por departamento con supermercado y estaciones de servicio (venta de gasolina y gas vehicular). • Conglomerado 6: Calificación más frecuente: no presenta un parámetro relevante. Establecimientos comerciales más frecuentados: sin nombre, almacenes de calzado, almacenes de electrodomésticos y gasodomésticos, librerías, aseguradoras, agencias de boletería (producciones de teatro) excepto cine, ópticas y artículos ópticos y colegios, universidades, institutos de educación tecnológica y prescolar. • Conglomerado 7: Calificación más frecuente: B. Establecimientos comerciales más frecuentados: servicios de ambulancia, comprar en Internet, suscripción por cable y otros servicios de radio y T.V. pagos, supermercados y tiendas exprés, almacén por departamento con supermercado, estaciones de servicio (venta de gasolina y gas vehicular), almacenes de vestuario y accesorios para toda la familia, mercadeo directo, servicios de seguros, mercadeo directo, comerciantes de ventas telefónicas – DIRECTV y casinos, juegos de azar, loterías y rifas. • Conglomerado 8: Calificación más frecuente: A. Establecimientos comerciales más frecuentados: sin nombre, aerolíneas, compras en Internet, transporte de carga en general, almacenes de computadores y software, entidades financieras, hoteles y centros vacacionales, compañías de alquiler de vehículos y asociaciones profesionales y gremios. Segundo enfoque: Recency, Antiquity and Monetize – RAM En este enfoque el objetivo es determinar los grupos de clientes con comportamientos similares, a partir de la novedad de sus transacciones, la antigüedad del tarjetahabiente con la entidad y la ganancia monetaria que representa el cliente para el Banco. 72 Teniendo en cuenta lo anterior se procedió a generar los grupos de interés para el análisis de los datos obtenidos. Se desean analizar los grupos de clientes que presentes características “buenas” y “malas” en cada una de las variables disponibles. Es así como se encuentran los siguientes ocho20 grupos objetivos: × × × × × × × × Primer grupo: Segundo grupo: Tercer grupo: Cuarto grupo: Quinto grupo: Sexto grupo: Séptimo grupo: Octavo grupo: Transacciones recientes, clientes antiguos y montos altos. Transacciones recientes, clientes antiguos y montos bajos. Transacciones recientes, clientes nuevos y montos altos. Transacciones recientes, clientes nuevos y montos bajos. Transacciones antiguas, clientes antiguos y montos altos. Transacciones antiguas, clientes nuevos y montos bajos. Transacciones antiguas, clientes antiguos y montos bajos. Transacciones antiguas, clientes nuevos y montos altos. El agrupamiento se realizó con respecto a la mediana de cada una de las variables con el fin de asignarle una calificación a cada cliente, en referencia con este estadístico. Sí los valores están por debajo o son iguales a la mediana, tienen asignada la calificación “baja”, representada por la letra B; y sí los valores están por encima de la mediana, tienen asignada la calificación “alta”, representada por la letra A. De esta forma, los ocho grupos objetivos quedan consolidados de la siguiente manera: Recency × × × × × × × × Primer grupo: Segundo grupo: Tercer grupo: Cuarto grupo: Quinto grupo: Sexto grupo: Séptimo grupo: Octavo grupo: B B B B A A A A Antiquity A A B B A B A B Monetize A B A B A B B A Adicionalmente, se procedió a clasificar a cada uno de los clientes dentro de alguno de estos grupos, obteniendo los siguientes resultados: GRUPO BAA BAB BBA BBB AAA NÚMERO DE CASOS 19.819 clientes 30.680 clientes 39.773 clientes 12.335 clientes 12.675 clientes % TOTAL 10,70% 16,56% 21,47% 6,66% 6,84% Se dividen las tres variables en dos grupos cada una (altos y bajos). Utilizando la regla de la multiplicación se obtiene que el número total de grupos de interés es ocho. 20 73 ABB AAB ABA TOTAL 14.157 clientes 25.899 clientes 29.930 clientes 185.268 clientes 7,64% 13,98% 16,15% 100% Tabla 11. Número y porcentaje de casos por conglomerado RAM. Fuente: La autora. El gráfico 17 ilustra el número de clientes en cada uno de los grupos encontrados. Gráfico 17. Número de clientes por conglomerado RAM. Fuente: La autora. Finalmente, para unificar la caracterización de los clientes se procedió a generar las tablas de contingencia entre los ocho primeros conglomerados y las características. A continuación se presentan los resultados obtenidos en la tabla de contingencia entre los grupos RAM identificados y los primeros ocho conglomerados. × Pruebas de chi cuadrado: La tabla de contingencia resultante entre los conglomerados iniciales y los grupos RAM fue significativa al nivel 5%. × Tablas de contingencias finales: Teniendo como base las tablas de contingencia, se realizó el análisis de éstos y se encontraron las siguientes características: • Conglomerado 1: Grupo RAM más frecuente: BAA y BBA. • Conglomerado 2: Grupo RAM más frecuente: BAB. • Conglomerado 3: Grupo RAM más frecuente: no presenta un parámetro relevante. • Conglomerado 4: Grupo RAM más frecuente: BBA. • Conglomerado 5: Grupo RAM más frecuente: ABA y BBA. 74 • • Conglomerado 6: Grupo RAM más frecuente: AAB, ABA, ABB, BBB. • Conglomerado 7: Grupo RAM más frecuente: AAA, BAA y BAB. • Conglomerado 8: Grupo RAM más frecuente: BBB. Tercer enfoque: Demografía de los clientes En este enfoque el objetivo es determinar las características demográficas más relevantes en cada uno de los ocho grupos iniciales. A continuación se listan los resultados obtenidos. × Pruebas de chi cuadrado: La tablas de contingencias resultantes entre los conglomerados iniciales y la demografía del cliente (edad, género, estado civil y ocupación) fueron significativa al nivel 5%. × Tablas de contingencias finales: Teniendo como base las tablas de contingencia, se realizó el análisis de éstos y se encontraron las siguientes características: • Conglomerado 1: Género más frecuente: masculino, edad más frecuente: entre 56 y 70 años, estado civil más frecuente: casado, ocupación más frecuente: independiente. • Conglomerado 2: Género más frecuente: femenino, edad más frecuente: entre 36 y 55 años, estado civil más frecuente: no presenta un parámetro relevante, ocupación más frecuente: no presenta un parámetro relevante. • Conglomerado 3: Género más frecuente: femenino, edad más frecuente: entre 36 y 55 años, estado civil más frecuente: no presenta un parámetro relevante, ocupación más frecuente: no presenta un parámetro relevante. • Conglomerado 4: Este grupo contiene empresas en su mayoría. Con respecto a las personas naturales: Género más frecuente: masculino, edad más frecuente: entre 26 y 35 años, estado civil más frecuente: casado, ocupación más frecuente: independiente. • Conglomerado 5: Género más frecuente: no presenta un parámetro relevante, edad más frecuente: entre 19 y 25 años y entre 26 y 35 años, estado civil más frecuente: soltero, ocupación más frecuente: independiente. • Conglomerado 6: Género más frecuente: femenino, edad más frecuente: entre 19 y 25 años y entre 26 y 35 años, estado civil más frecuente: unión libre, ocupación más frecuente: empleado. 75 • Conglomerado 7: Género más frecuente: femenino, edad más frecuente: entre 35 y 55 años y entre 56 y 70 años, estado civil más frecuente: casado, ocupación más frecuente: independiente. • Conglomerado 8: Este grupo contiene empresas en su mayoría. Con respecto a las personas naturales: Género más frecuente: masculino, edad más frecuente: entre 26 y 35 años, estado civil más frecuente: casado, ocupación más frecuente: independiente. De acuerdo con lo anterior, se pueden nombrar cada uno de los conglomerados de acuerdo con las características que presenta. La tabla 12 presenta la denominación que se le ha dado a cada uno de los segmentos de clientes identificados. NÚMERO DE CONGLOMERADO 1. 2. 3. 4. 5. 6. 7. 8. DENOMINACIÓN CLIENTES EJECUTIVOS - V.I.P. CLIENTES PROMEDIO. CLIENTES “NOVEMBRINOS”. CLIENTES INTERNACIONALES CON ALTOS MONTOS. CLIENTES SEGUNDO TRIMESTRE DEL AÑO EN SUPERMERCADOS. CLIENTES OCASIONALES. CLIENTES COMPULSIVOS – URGENTES. CLIENTES INTERNACIONALES CON BAJOS MONTOS. Tabla 12. Denominación de los conglomerados. Fuente: La autora. En resumen, la tabla 13 presenta la descripción de las características más relevantes de los ocho grupos encontrados, teniendo en cuenta el comportamiento transaccional, la preferencia de establecimientos comerciales, la calificación de crédito, la clasificación RAM y la demografía (edad, género, estado civil y ocupación). Esto permite caracterizar a los tarjetahabientes por comportamientos, lo que implica la generación de estrategias personalizadas. 76 (42.239) 2. (2.542) 1. NÚMERO DE GRUPO Gran cantidad de transacciones. Transacciones internacionales. Alta variabilidad en los montos declinados. Altos porcentajes de extra cupo. No presenta un parámetro relevante. Clientes con comportamientos promedio. • • • • COMPORTAMIENTO TRANSACCIONAL • • • • • • • • • 77 Contratistas generales, residenciales y comerciales. Almacenes por departamento sin supermercado. Almacenes de misceláneas, cacharrerías y artículos para regalo. Supermercados y tiendas express. Almacén por departamento con supermercado. Almacenes de vestuario y accesorios para toda la familia. Droguerías, farmacias, tiendas naturistas. Mercadeo directo, servicios de seguros. Mercadeo directo, comerciantes de ventas telefónicas - DIRECTV. Hoteles y centros vacacionales. • • • • • Aerolíneas. Compras en Internet. Transporte de carga en general. Almacenes de computadores y software. Entidades financieras. Hoteles y centros vacacionales. Compañías de alquiler de vehículos. Asociaciones profesionales y gremios. • • • • MCC PREFERENTE D y E. A. CALIF.DE CRÉDITO BAA Transacciones recientes, clientes antiguos y montos altos. BBA: Transacciones recientes, clientes nuevos y montos altos. • BAB: Transacciones recientes, clientes antiguos y montos bajos. En general son clientes con transacciones recientes que generan montos altos de utilidad. • • RAM • • • • • • • • Género: Femenino. Edad: Entre 36 y 55 años. Estado civil: Sin parámetro relevante. Ocupación: Sin parámetro relevante. Género: Masculino. Edad: Entre 56 y 70 años. Estado civil: Casado. Ocupación: Independiente. DEMOGRAFÍA (34.145) 5. (2.868) • • • 4. • • • (17.560) 3. • Transacciones realizadas en marzo, abril y mayo. Alta variabilidad en los montos declinados. Transacciones internacionales. Transacciones no realizadas en la tarde. Bajo porcentaje de extra cupo. Transacciones frecuentes en noviembre. Poca frecuencia de transacciones en junio. • • • • 78 Venta de equipos y servicios de telecomunicaciones. Almacenes por departamento sin supermercado. Supermercados y tiendas express. Almacén por departamento con supermercado. Estaciones de servicio (venta de gasolina y gas vehicular). • • • • Sin nombre. Compras en Internet. Almacenes de computadores y software. Entidades financieras. Compañías de alquiler de vehículos. Asociaciones profesionales y gremios. Aerolíneas. Almacenes por departamento sin supermercado. Supermercados y tiendas express. • • • • • • A. A. C y D. ABA Transacciones antiguas, clientes nuevos y montos altos. BBA: Transacciones recientes, clientes nuevos y montos altos. • En general son clientes nuevos que generan montos altos de utilidad. • BBA: Transacciones recientes, clientes nuevos y montos altos. • No presenta un parámetro relevante. Género: Femenino. Edad: Entre 36 y 55 años. Estado civil: Sin parámetro relevante. Ocupación: Sin parámetro relevante. • • • • • • • • Género: Sin parámetro relevante. Edad: Entre 19 y 25 años y 26 y los 35 años. Estado civil: Soltero. Ocupación: Independiente. Género: Masculino. Edad: Entre 26 y 35 años. Estado civil: Casado. Ocupación: Estudiante. En persona natural presentan el siguiente comportamiento: Comportamiento relevante en personas jurídicas. • • • • (27.846) 7. (62.205) 6. • • • • • Gran cantidad de transacciones declinadas. Alta variabilidad en los montos declinados. Altos porcentaje de extra cupo. Pocas transacciones declinadas. Baja variabilidad en los montos declinados. • • • • • • • • • • • • • • • • • • 79 Servicios de ambulancia. Comprar en Internet. Suscripción por cable y otros servicios de radio y T.V. pagos. Supermercados y tiendas express. Almacén por departamento con supermercado. Estaciones de servicio (venta de gasolina y gas vehicular). Almacenes de vestuario y accesorios para toda la familia. Mercadeo directo, servicios de seguros. Mercadeo directo, comerciantes de ventas telefónicas - DIRECTV. Casinos, juegos de azar, loterías y rifas. Sin nombre. Almacenes de calzado. Almacenes de electrodomésticos y gasodomésticos. Librerías. Aseguradoras. Agencias de boletería (producciones de teatro) excepto cine. Ópticas y artículos ópticos. Colegios, universidades, institutos de educación tecnológica y prescolar. B. No presenta un parámetro relevante. AAB: Transacciones antiguas, clientes antiguos y montos bajos. ABA Transacciones antiguas, clientes nuevos y montos altos. ABB: Transacciones antiguas, clientes nuevos y montos bajos. BBB: Transacciones recientes, clientes nuevos y montos bajos. AAA Transacciones antiguas, clientes antiguos y montos altos. BAA Transacciones recientes, clientes antiguos y montos altos. BAB: Transacciones recientes, clientes antiguos y montos bajos. En general son clientes antiguos, con transacciones recientes y montos altos de utilidad. • • • En general son clientes nuevos, con transacciones antiguas y montos bajos de utilidad. • • • • • • • • • • • • Género: Femenino. Edad: Entre 36 y 55 años y 56 y los 70 años. Estado civil: Casado. Ocupación: Independiente. Género: Femenino. Edad: Entre 19 y 25 años y 26 y 35 años. Estado civil: Unión libre. Ocupación: Empleado. (4.105) 8. • • Transacciones internacionales. Altos promedios de montos declinados. • • • • • • • • • A. • BBB: Transacciones recientes, clientes nuevos y montos bajos. 80 Fuente: La autora. Tabla 13. Descripción de las características de los conglomerados. Sin nombre. Aerolíneas. Compras en Internet. Transporte de carga en general. Almacenes de computadores y software. Entidades financieras. Hoteles y centros vacacionales. Compañías de alquiler de vehículos. Asociaciones profesionales y gremios. • • • • Género: Masculino. Edad: Entre 26 y 35 años. Estado civil: Casado. Ocupación: Independiente. En persona natural presentan el siguiente comportamiento: Comportamiento relevante en personas jurídicas. 5.5. POLÍTICAS PROPUESTAS De acuerdo con los parámetros y características que describen el comportamiento de los tarjetahabientes del Banco Davivienda S.A. que han declinado sus transacciones por fondos insuficientes, a continuación se presentan las políticas propuestas como herramienta para mejorar el proceso de valoración y otorgamiento de extra cupos dentro de la entidad. Cabe destacar que dichas políticas están basadas en un enfoque comercial, que permite fidelizar al cliente y recompensarlos con características de interés para la entidad. Los criterios para generar los parámetros de aprobación de extra cupos están basados en el comportamiento y conocimiento del negocio por parte de la Unidad de Inteligencia de Negocios de la Vicepresidencia de Medios de Pago21. Se estipularon siete características principales a tener en cuenta en el momento de autorizar el extra cupo: 1. Los porcentajes de extra cupos autorizados deben oscilar entre el 10% y el 40% del total del cupo asignado en la tarjeta de crédito. Lo anterior implica que así como el porcentaje de autorización de extra cupo para todas las tarjetas de crédito de la franquicia Diners es del 20%, las tarjetas de las franquicias Visa y MasterCard, por abarcar segmentos más diferenciados de clientes, deben permitir porcentajes de autorización de extra cupos de acuerdo con el tipo de tarjeta o el monto total de cupo. Se establece la autorización de unos porcentajes entre el 10% y el 20% para cupos menores o iguales a seis millones de pesos, entre el 21% y el 30% para cupos mayores a seis millones de pesos, pero menores a diez millones pesos, y un extra cupo de entre 31% y 40% para cupos mayores a diez millones de pesos. 2. El límite inferior de utilidad por intereses corrientes debe ser de $50.000 anuales. 3. Los clientes que pertenecen a grupos que presentan estacionalidad en el tiempo, es decir, presentan transacciones en meses específicos del año, deben tener las mismas políticas que los clientes promedio, pues se considera que los clústeres asociados al segundo trimestre del año y el mes de noviembre hacen parte de un comportamiento especifico del período estudiado y no conforman un patrón repetitivo todos los años. 4. A los clientes ejecutivos y a los clientes con transacciones internacionales se les debe autorizar en todas sus transacciones un 30% de extra cupo, ya que a este tipo de clientes se les da un trato preferencial dentro del Banco Davivienda S.A. 5. Los clientes promedio tienen un límite máximo de dos extra cupos por año, ya que se espera que este tipo de clientes no decline con frecuencia sus transacciones por fondos insuficientes. Se considera que este tipo de clientes está informado de la disponibilidad de cupo antes de realizar sus compras por lo que no suelen excederse en los montos de sus transacciones. 21 Validado con el Especialista de la Unidad de Inteligencia de Negocios de la Vicepresidencia de Medios de Pago. 81 6. A los clientes del grupo de los compulsivos urgentes se les deben autorizar máximo tres extra cupos anuales. 7. Los parámetros de comparación para la novedad de las transacciones y la antigüedad con la entidad deben ser cero meses y dos años, respectivamente. 8. Mantener las políticas actuales de autorización de extra cupos, con la diferencia de que deben ser realizadas por el Banco Davivienda S.A. y no por las redes dueñas de las franquicias Visa y MasterCard. La tabla 14 sintetiza los parámetros estipulados anteriormente a los grupos encontrados. CONGLOMERADO 1. POLÍTICA • CLIENTES EJECUTIVOS V.I.P. 4. CLIENTES INTERNACIONALES CON ALTOS MONTOS. 8. CLIENTES INTERNACIONALES CON BAJOS MONTOS. • • • En el caso contrario se deben mantener las mismas condiciones que había estipulado con anterioridad el Comité de Riesgo del Banco Davivienda S.A. • 2. CLIENTES PROMEDIO. 3. CLIENTES • • “NOVEMBRINOS”. • 5. CLIENTES SEGUNDO TRIMESTRE DEL AÑO EN SUPERMERCADOS. Antigüedad: Mayor o igual a dos años. Facturación promedio mensual: 10 veces el ticket promedio mensual. Utilidad: Mayor a $500.000 anuales (10 veces el límite inferior de la utilidad). Porcentaje de extra cupo: 30%. Antigüedad: Mayor o igual a dos años. Utilidad: Mayor a $50.000 anuales (10 veces el límite inferior de la utilidad). Porcentaje de extra cupo: 15%. Máximo dos extra cupos al año. Recency: 0 meses. Se deben mantener las mismas condiciones que había estipulado con anterioridad el Comité de Riesgo del Banco Davivienda S.A. 82 JUSTIFICACIÓN Se busca con esta política mejorar la cobertura a este tipo de clientes. Se sabe que realizan en su mayoría transacciones internacionales, son clientes con transacciones recientes y generan altos montos de utilidad a la entidad. La estrategia está encaminada a flexibilizar el producto y ampliar la cobertura. Se busca permitirles acceder a los bienes y servicios que están demandando en alguna oportunidad. 6. CLIENTES OCASIONALES. Se les autorizarán sin ninguna restricción hasta dos extra cupos al año, de máximo el 25% del cupo de cualquiera de sus tarjetas de crédito, sin importar el número de éstas en su portafolio. • • 7: CLIENTES COMPULSIVOS – URGENTES. • Antigüedad: Mayor o igual a dos años. Utilidad: Mayor a $100.000 anuales (2 veces el límite inferior de la utilidad). Porcentaje de extra cupo: 20%. Máximo tres extra cupos al año. En el caso contrario se deben mantener las mismas condiciones que había estipulado con anterioridad el Comité de Riesgo del Banco Davivienda S.A. Se busca flexibilizar la política con estos clientes dado que su comportamiento transaccional en extra cupos es ocasional. La estrategia busca incrementar el consumo de este tipo de clientes permitiéndole acceder a los bienes y servicios que demandan en los establecimientos comerciales más frecuentes. Se enfoca en los mejores clientes de esta clasificación. Tabla 14. Políticas por conglomerado. Fuente: La autora. En general, las políticas anteriormente mencionadas sirven como herramienta para la optimización del proceso de valoración y otorgamiento de extra cupos dentro del Banco Davivienda S.A. Sin embargo, es indispensable que antes de ser implementadas, sean valoradas por el Comité de Riesgo. 83 6. PROPUESTA FINAL A continuación se presenta la descripción de la propuesta final. 6.1. DESCRIPCIÓN GENERAL La propuesta consiste en generar un archivo dentro del aplicativo AS 400, que basado en las características encontradas en el presente trabajo de grado, actualice el autorizador de tarjeta de crédito, para otorgar extra cupos en las transacciones realizadas por los tarjetahabientes del Banco Davivienda S.A., en los casos en que los cupos no son suficientes para permitirles adquirir los bienes y servicios. La propuesta abarca a todos los tarjetahabientes y todas las modalidades de tarjeta de crédito ofrecidas por la entidad. 6.2. METODOLOGÍA PROPUESTA Para poder generar el archivo dentro del aplicativo AS 400 se debe cruzar la información actualizada de la calificación de crédito del cliente, los parámetros que establezca el Comité de Riesgo del Banco Davivienda S.A., los datos del aplicativo y las características propuestas por el presente trabajo de grado, para generar los parámetros que van a ser introducidos en el autorizador de transacciones. Se debe tener presente que el uso de esta información es totalmente confidencial, y que el área encargada de manejar los parámetros de autorización debe ser el Departamento de Monitoreo de Medios de Pago del Banco Davivienda S.A. 6.3. OBJETIVO FINAL El objetivo final es generar un mecanismo que permita asignar adecuadamente extra cupos a los tarjetahabientes del Banco Davivienda S.A, otorgándolos exclusivamente a los clientes que los requieren y los pueden pagar, y a los clientes que el Banco Davivienda S.A. considera importantes dentro de su gestión. Lo anterior implica que se está generando un proceso de valoración y otorgamiento de extra cupos más eficiente, donde se busca mejorar el servicio al cliente, aumentar la facturación del producto de tarjeta de crédito y disminuir los costos asociados a éste. 84 6.4. ASPECTOS IMPORTANTES22 De acuerdo con un análisis previo que se realizó en el Departamento de Monitoreo de Medios de Pago del Banco Davivienda S.A., se identificó que existen dos aspectos importantes a tener en cuenta en el momento de implementar la propuesta presentada. 1. Se debe desarrollar un módulo de captura que permita a las áreas de operaciones ingresar los parámetros definidos por el Comité de Riesgo. 2. Es indispensable generar una opción en el sistema que permita ingresar las tarjetas de crédito de los clientes que no desean obtener el beneficio de extra cupos. 6.5. PROCESO INVOLUCRADO El proceso que se debe llevar a cabo para implementar la propuesta consta de cuatro insumos fundamentales: (i) Parámetros del Comité de Riesgo, (ii) Calificación Datacrédito, (iii) Parámetros de comportamiento, RAM y demográficos y (iv) Archivo de excepciones; y dos procesos básicos: (i) Generación del archivo para el autorizador y (ii) Programación de la funcionalidad del autorizador. A continuación se presenta la descripción de cada uno de estos. 6.5.1. 1. Insumos de la propuesta Parámetros del Comité de Riesgo El Comité de Riesgo es el encargado de tomar decisiones con respecto a las modificaciones, recomendaciones e implementaciones de nuevas políticas en los productos y servicios que ofrece el Banco Davivienda S.A. Con respecto al proceso de valoración y otorgamiento de extra cupos, el Comité ha generado unos parámetros para el adecuado funcionamiento del servicio dentro de la entidad, por lo tanto, se debe desarrollar una opción que permita al usuario, mediante un perfil único, el ingreso de los parámetros definidos, donde se permita especificar los siguientes campos: (i) BIN, (ii) Tipo de tarjeta (principal, amparada, extendida), (iii)Tipo de extra cupo (fijo o porcentual), (iv) Valor del extra cupo, (v) Máximo valor permitido de extra cupo en compras nacional, (vi) Máximo valor permitido de extra cupo en avances nacional, (vii) Máximo valor permitido de extra cupo en compras internacional y (viii) Máximo valor permitido de extra cupo en avances internacional (BANCO DAVIVIENDA S.A., 2010). 2. 22 Calificación Datacrédito (BANCO DAVIVIENDA S.A., 2010) 85 El Banco Davivienda S.A. a través del Departamento de Análisis de Riesgo de Crédito tiene acceso a la base de datos suministrada por Datacrédito. De esta forma, esta área será la encargada de entregar un archivo plano con el número de cédula y la calificación del cliente, para que junto con el número de identificación se ubiquen en aplicativo AS 400 los números de tarjetas asociados a cada cliente, identificando el BIN al que pertenece la tarjeta. La estructura del archivo debe ser: (i) Tipo de identificación, (ii) Número de identificación y (iii) Calificación (BANCO DAVIVIENDA S.A., 2010). 3. Parámetros de comportamiento, RAM y demográficos De acuerdo con los resultados obtenidos en el presente trabajo de grado, se debe desarrollar una opción que permita al usuario, mediante un perfil único, el ingreso de los parámetros definidos, donde se permita especificar los siguientes campos: Novedad de las transacciones, Antigüedad del cliente, Rentabilidad del cliente, MCC más frecuente, Número de transacciones declinadas el último año, Porcentaje de transacciones nacionales y Porcentaje de transacciones internacionales. 4. Archivo de excepciones Se debe crear una opción que permita ingresar el número de cédula y el número de tarjeta de los clientes que han decidido no acceder al servicio de extra cupos, con el fin de retirarlos del archivo que se enviará al autorizador. Esta captura debe realizarse centralizadamente en el Departamento de Monitoreo Medios de Pago (BANCO DAVIVIENDA S.A., 2010). 6.5.2. 1. Procesos de la propuesta Generación del archivo para el autorizador Una vez se ubiquen en aplicativo AS 400 los números de tarjetas asociados a cada cliente identificando el BIN al que pertenece la tarjeta, se debe generar un archivo donde teniendo como llave de validación el BIN y la calificación del archivo de DataCrédito, se debe adicionar a cada tarjeta los valores de extra cupo para compras y avances nacionales o internacionales, teniendo en cuenta la calidad de la misma (principal o amparada), la definición del tipo de extra cupo determinado en los parámetros del Comité de Riesgo y las características encontradas en el presente trabajo de grado. Una vez se genere el archivo, deben consultarse las excepciones y retirar del archivo de salida las tarjetas que se encuentren como excepciones (BANCO DAVIVIENDA S.A., 2010). La generación de este archivo debe ser mensual y se debe asegurar la seguridad de la transmisión de información entre el AS 400 y el Autorizador ON/2. 86 2. Programación de la funcionalidad del autorizador Cuando se ha identificado que una transacción debe ser declinada por fondos insuficientes, el autorizador debe validar el archivo de extra cupos generado por el AS400. Sí la tarjeta se encuentra en el archivo, se debe sumar al valor disponible en ese momento en el autorizador, el valor del archivo de extra cupo. Sí la sumatoria es mayor que el valor de la transacción se debe enviar un mensaje de transacción autorizada, de lo contrario, se debe enviar un mensaje de declinación de la transacción por fondos insuficientes. Una vez se aprueba la transacción, se debe disminuir el valor utilizado del extra cupo, del valor total autorizado en el archivo de extra cupos (BANCO DAVIVIENDA S.A., 2010). El gráfico 18 representa este proceso. Gráfico 18. Proceso de valoración y otorgamiento de extra cupos propuesto. Fuente: La autora. Al finalizar el mes, el autorizador debe generar un registro con el detalle de todas las transacciones que consultaron el archivo de extra cupos, especificando las transacciones aprobadas y las transacciones declinadas (Ibídem, p. 86). Cabe aclarar que el Departamento de Monitoreo de Medios Pago del Banco Davivienda S.A. dentro de sus procedimientos tiene encargado hacer el control y desarrollo de los parámetros que le permiten al Autorizador 73 Stratus ON/ 223 funcionar correctamente. Lo anterior implica que el Analista III encargado de programar la funcionalidad del Autorizador puede modificar (eliminar o agregar) los parámetros para la autorización de extra cupos. Actualmente las políticas están ligadas a las decisiones que tome el Comité de Riesgo del Banco Davivienda en cuanto al correcto funcionamiento del producto de tarjeta de crédito, específicamente la tarjeta de crédito Diners. Existe la posibilidad de hacer modificaciones en los parámetros de autorización de todas las tarjetas de crédito de la entidad, es decir que incluye las franquicias Diners, Visa y MasterCard. 23 Medio a través del cual se hacen las autorizaciones o declinaciones de transacciones con tarjeta de crédito. 87 7. EVALUACIÓN DE LA PROPUESTA A continuación se presenta la evaluación cualitativa y cuantitativa de la propuesta, con el fin de analizar, evaluar y medir el impacto que tiene para el Banco Davivienda S.A. la implementación y puesta en marcha de los parámetros encontrados en el proceso de valoración y otorgamiento de extra cupos. 7.1. ANÁLISIS CUALITATIVO Hacer uso de herramientas matemáticas y estadísticas para determinar el comportamiento de los tarjetahabientes que han declinado sus transacciones por fondos insuficientes, permite al Banco Davivienda S.A. generar políticas y parámetros eficientes para mejorar el proceso interno de valoración y otorgamiento de extra cupos. Los impactos de la presente propuesta pueden ser clasificados cualitativamente de acuerdo con las características más relevantes que están vinculadas al proceso. A continuación se listan los impactos cualitativos identificados. 1. Segmentación de clientes: La presente propuesta le brinda al Banco Davivienda S.A. la posibilidad de conocer a sus tarjetahabientes desde tres perspectivas diferentes: comportamiento en declinaciones por fondos insuficientes, comportamiento histórico con la entidad (novedad de las transacciones, antigüedad con la entidad y valor monetario) y demografía. Lo anterior le permite un mejor perfilamiento de sus clientes, y es una herramienta básica para la toma de decisiones y la generación de estrategias que permitan mejorar los procesos internos de la entidad. 2. Mejor utilización de la información disponible: A través del mecanismo de Minería de Datos generado, se abre la posibilidad de emplear la información disponible en los aplicativos de la entidad. Implica una mejor utilización de los recursos disponibles. 3. Servicio al cliente: La propuesta busca mejorar la relación con el cliente adecuándose a las características más relevantes de cada uno de éstos. El propósito general es mejorar la relación con el cliente, ofreciéndole un servicio que le permite obtener el beneficio de extra cupo en sus transacciones con su tarjeta de crédito. Se busca generar herramientas de fidelización del cliente con la entidad. 4. Imagen del Banco Davivienda S.A.: Autorizar extra cupos a los tarjetahabientes de la entidad permite mejorar la imagen y la percepción que tienen los clientes de su Banco. Brinda la posibilidad de que los clientes sientan que el producto de tarjeta de crédito y en general el Banco Davivienda S.A. lo acompañan y le ofrecen servicios que se ajustan a sus necesidades y expectativas. 88 5. Estrategias de mercado: Permite valorar la posibilidad de otorgar extra cupos a los tarjetahabientes, basado no sólo en su comportamiento crediticio, sino que también, en estrategias de mercado que están alineadas con las políticas del Banco y el negocio de las tarjetas de crédito. 6. Proceso eficiente: Se espera que la propuesta contribuya a disminuir los tiempos de operación del proceso, eliminar las operaciones de consulta de ACIERTA por parte de las redes y disminuir los costos asociados a esta consulta. 7.2. ANÁLISIS CUANTITATIVO De acuerdo con el Informe de Gastos por Servicios de ACIERTA para el año 2010 y el primer cuatrimestre del 2011, suministrado por el Departamento de Monitoreo de Medios de Pago, y el Informe Gerencial de Tarjeta de Crédito acumulado a octubre de 2011, suministrado por la Unidad de Inteligencia de Negocios de la Vicepresidencia de Medios de Pagos, se realizó el análisis cuantitativo de la propuesta. A continuación se lista la información disponible. 1. Costos por servicio de ACIERTA: Como no se cuenta con la información actualizada de los gastos por servicio de ACIERTA para los últimos cuatrimestres del 2011, se asumirán como base de estudio los costos presentados en el año 2010. Esta información está disponible en la tabla 15. El costo total del servicio de ACIERTA es de $326.887.803 anuales. 2010 PRIMER CUATRIMESTRE SEGUNDO CUATRIMESTRE TERCER CUATRIMESTRE TOTAL NÚMERO DE TRX VISA PROMEDIO TARIFA DE CONSULTA ($) COSTO TOTAL ($) NÚMERO DE TRX MASTER CARD PROMEDIO TARIFA DE CONSULTA ($) COSTO TOTAL ($) 44.069 601 26.485.469 99.461 774 76.982.814 47.040 604 28.412.160 88.831 774 68.755.194 52.006 604 31.411.624 122.533 774 94.840.542 143.115 603 $ 86.309.253 310.825 774 $ 240.578.550 Tabla 15. Gastos por servicios de ACIERTA 2010. Fuente: La autora. 89 $ 1.200.000 $ 2.400.000 Salario mensual $0 $0 Subs. De transp. $ 199.920 $ 99.960 $ 99.960 $ 199.920 Prima 8,33% $ 49.920 $ 99.840 ICBF 3% SENA 2% Salud 8,5% Pensión 12% $ $ $ $ 144.000 36.000 24.000 102.000 $ $ $ $ 96.000 $ 288.000 72.000 48.000 204.000 $ 48.000 Caja Vacac. compen 4,16% 4% SEGURIDAD SOCIAL Fuente: La autora. Tabla 16. Salario anual con factor prestacional por cargo. $ 24.000 $ 12.000 Int. Cesantías Cesantía 8,33% 1% PARAFISCALES $ 12.480 $ 24.960 ARP 1,04% $43.879.680 $ $ 3.656.640 1.256.640 Salario anual $21.930.840 Salario mensual final $ 628.320 $ 1.828.320 Total FP 52,36% 24 90 Información tomada del Informe de Cobros de Tarjeta de Crédito a mayo de 2011, suministrada por la Superintendencia Financiera de Colombia. El número promedio de períodos fue suministrado por un Especialista de la Unidad de inteligencia de Negocios de la Vicepresidencia de Medios de Pago del Banco Davivienda S.A. 25 Esta información corresponde a los salarios mensuales vigentes para estos cargos dentro del Banco Davivienda S.A. Profesional II Analista III Cargos PRESTACIONES SOCIALES 5. Personal requerido para la realizar el proceso propuesto: Se considera que serán necesarias dos personas para realizar el proceso de minería de datos que permita generar los parámetros para la autorización de los extra cupos. El personal requerido es: un Analista III con un salario mensual de $1.200.000 y un Profesional II con un salario mensual de $2.400.00025. La tabla 16 presenta el salario final del personal, incluyendo el factor prestacional. 4. Variables del producto de tarjeta de crédito: Las variables asociadas a las tarjetas de crédito son: (i) tasa efectiva anual: 26,38%, (ii) número promedio de cuotas: 9 meses24. 3. Facturación promedio: La facturación promedio mensual de los tarjetahabientes de es $ 267.000. 2. Número de transacciones declinadas a través de POS: De acuerdo con las cifras publicadas en el Informe Gerencial de Tarjeta de Crédito, la cantidad de transacciones declinadas por fondos insuficientes en el año 2010 fue de 1.219.817, y en el período comprendido entre enero de 2011 y junio de 2011, la cantidad de transacciones declinadas por fondos insuficientes fue de 670.318. El porcentaje promedio anual de declinaciones es del doce por ciento. Adicionalmente se deben tener en cuenta los beneficios adicionales que el Banco Davivienda S.A. entrega a sus empleados: bonos de almuerzo (360 almuerzos a $7.000 cada uno) y uniformes (5 uniformes anuales a $200.000 cada uno). La tabla 17 resume esta información. SALARIO ANUAL ALMUERZOS UNIFORMES SALARIO TOTAL $21.930.840 $2.520.000 $1.000.000 $25.450.840 $43.879.680 $2.520.000 $1.000.000 $47.399.680 Tabla 17. Salario anual por cargos, incluidos los beneficios del Banco Davivienda S.A. Fuente: La autora. 6. Herramientas de trabajo: Para la correcta realización de las tareas del personal se hace necesaria la implementación de dos puestos de trabajo equipados con computadores y software especializado para la realización de la Minería de Datos (Microsoft Excel, Microsoft Access y SPSS). Se estima que el costo total de la implementación es de $3.000.000 anuales, en la que se incluyen los servicios públicos, el hardware, el software y las herramientas de oficina requeridas por el personal. Es importante aclarar que el impacto de la implementación de la propuesta no puede ser medido en el escenario actual, pues no se cuenta con la información relacionada con el desempeño de la propuesta. Sin embargo se propone realizar pruebas piloto, con las políticas más fuertes, para posteriormente analizar el impacto real de la implementación. Para el presente análisis se proponen tres posibles escenarios con la implementación de la propuesta: (i) escenario pesimista, en el que se espera que el porcentaje de transacciones declinadas disminuya máximo un punto porcentual; (ii) escenario intermedio, en el que se espera que el porcentaje de transacciones declinadas disminuya máximo hasta cuatro puntos porcentuales y (iii) escenario optimista, en el que se espera que las transacciones declinadas disminuya hasta siete puntos porcentuales. La comparación entre los escenarios propuestos y la situación actual busca dar un panorama general del posible impacto que puede tener la implementación de la propuesta en el nivel de servicio, el número de transacciones aprobadas, los intereses asociados a estas aprobaciones, el costo de los recursos necesarios para llevar a cabo el proceso propuesto y los beneficios asociados a éstos, dentro del Banco Davivienda S.A. La tabla 18 presenta esta comparación26. 26 Comparación basada en los datos disponibles a 2010. 91 ESCENARIO SITUACIÓN ACTUAL SUPUESTOS IMPACTO Número de transacciones declinadas 1.219.817 Tasa de interés efectiva anual 26,38% Número de períodos promedio anuales 0,75 Ticket promedio Mano de obra anual propuesto $ 1.207.619 Tasa de interés efectiva anual 26,38% Número de períodos promedio anuales 0,75 Mano de obra anual propuesto ii. INTERMEDIA $ Número de transacciones declinadas 1.171.619 Tasa de interés efectiva anual 26,38% Número de períodos promedio anuales 0,75 Ticket promedio Mano de obra anual propuesto Costo consulta de ACIERTA $ 267.000 $ (72.850.520) BENEFICIO TOTAL Nuevo número de transacciones aprobadas Montos de transacciones aprobadas Interés promedio anual generado Herramientas de trabajo propuestas Costo consulta de ACIERTA Nuevo número de transacciones aprobadas Montos de transacciones aprobadas Interés promedio anual generado Herramientas de trabajo propuestas $ 1,463,455,743 92 0 $0 $0 $ - $0 12.198 $ $ 3.256.911.390 $ 368.356.386 $ (3.000.000) 358.356.386 $ 267.000 $ (72.850.520) BENEFICIO TOTAL $ 326.887.803 (326.887.803) Número de transacciones declinadas Ticket promedio Número de transacciones aprobadas Montos de transacciones aprobadas Interés promedio anual generado Herramientas de trabajo propuestas $ 267.000 $ - BENEFICIO TOTAL i. PESIMISTA Costo consulta de ACIERTA $0 48.793 $ 13.027.645.560 $ 1.473.455.742 $ (3.000.000) iii. OPTIMISTA Número de transacciones declinadas 1.134.430 Tasa de interés efectiva anual 26,38% Número de períodos promedio anuales 0,75 Ticket promedio Mano de obra anual propuesto $ 267.000 $ (72.850.520) BENEFICIO TOTAL Costo consulta de ACIERTA Nuevo número de transacciones aprobadas Montos de transacciones aprobadas Interés promedio anual generado Herramientas de trabajo propuestas $0 85.387 $ $ 22.798.329.000 $ 2.578.524.901,11 $ (3.000.000) $ 2,568,524,901 Tabla 18. Comparación entre la situación actual y los escenarios propuestos Fuente: La autora. De lo anterior se puede concluir que la implementación de la propuesta genera un impacto positivo en los costos actuales del proceso de valoración y otorgamiento de extra cupos. De acuerdo con los parámetros propuestos, no se haría necesario el contrato con las redes para consultar ACIERTA, lo que implica una reducción en los costos de aproximadamente 400 millones de pesos. Los beneficios monetarios para la entidad aumentan considerablemente gracias al aumento del número de transacciones aprobadas. 93 CONCLUSIONES Una vez culminado el proceso de minería de datos propuesto para optimizar el proceso de valoración y otorgamiento de extra cupos dentro del Banco Davivienda S.A., se puede concluir que el aprendizaje más valioso que aportó este trabajo de grado a la organización, fue la posibilidad de personalizar las estrategias que se pueden aplicar al producto de tarjeta de crédito, de acuerdo con las características propias de cada cliente. El análisis de conglomerados dio una visión masiva de las características del cliente. El análisis subsiguiente sugiere identificar qué hacer con la información, cómo explotarla, cómo sacar el mayor provecho de ella y qué decisiones tomar en cuanto a los parámetros identificados. Se puede concluir que las acciones a realizar pueden ir desde el enfoque de la maximización de las utilidades, la identificación de nichos de mercado relevantes, hasta la modificación de patrones de comportamiento y características significativas. El reto que propone este tipo de análisis es identificar, una vez se tiene la información, qué se desea hacer con ella. Cabe destacar que el objetivo principal es generar conocimiento a partir de la información disponible y no generar juicios de valor sobre asuntos morales que juzguen las preferencias de un determinado conjunto de clientes. Para esto se hizo necesario el conocimiento del negocio, pues es la base para la generación de estrategias pertinentes que permitan dinamizar y hacer más eficiente el proceso impactado. La gran ventaja de la minería de datos y específicamente del análisis de conglomerados de K medias que se llevó a cabo en el presente trabajo de grado, es que se hizo uso de los recursos propios de la entidad, lo que permitió conocer a los clientes desde la segmentación propuesta (por comportamiento transaccional, trayectoria dentro del Banco Davivienda S.A y perfil demográfico), analizando y dando sentido a la información que estaba disponible en el almacén de datos, pero que con anterioridad no había sido valorada. Este trabajo de grado sirve como modelo para próximos estudios de este tipo, que busquen generar impactos en otros procesos del Banco Davivienda S.A. Adicionalmente, la segmentación RAM, que en principio fue inspirada por el análisis RFM, permite al Banco Davivienda S.A. generar estrategias encaminadas a fidelizar y retener a los tarjetahabientes, a partir de sus comportamientos como clientes y su trayectoria dentro la entidad. Este análisis y clasificación puede ser útil no sólo en el proceso de valoración y otorgamiento de extra cupos, sino que también puede servir como base para futuros análisis en otros procesos y otras áreas de la entidad. Todo lo anterior es de gran utilidad ya que los clientes se empiezan a tener en cuenta y pasan a ser parte activa dentro de los procesos internos de la organización. Se puede concluir que ésta es una primera aproximación para que los clientes no sean sólo un número más, dentro de una gran base de datos, sino que también permitan desde sus preferencias y características propias, diferenciar estrategias y políticas que estén acorde con sus preferencias. Aunque esto implica un riesgo desde el punto de vista crediticio, este tipo de procesos basados en la segmentación de las características de los clientes, pueden permitir procesos eficientes que satisfagan las necesidades de los usuarios, ya que se tiene conocimiento de ellos y se sabe de antemano qué es lo que están buscando y qué es lo que prefieren. La propuesta actual para el proceso de 94 valoración y otorgamiento de extra cupos puede ser interpretada como una herramienta para disminuir el riesgo de generar extra cupos a personas que de acuerdo con los intereses del Banco Davivienda S.A. no representan gran impacto e interés, y recompensar a los que presentan características atrayentes desde la perspectiva del negocio de las tarjetas de crédito. De esta misma forma, el perfil demográfico del cliente puede permitir a la entidad tener un parámetro predefinido para la valoración de los comportamientos de los clientes nuevos. Cabe mencionar que una de las etapas críticas del proceso de minería de datos es la limpieza y transformación de las variables, pues requiere de un conocimiento profundo de las características que describen a cada una de éstas. En este proceso se incluyen actividades como la identificación de datos ausentes, datos atípicos, comportamientos característicos de las variables y la validación de los supuestos estadísticos. Adicionalmente se requiere de un constante análisis de los objetivos del proyecto para tomar decisiones que permitan codificar los datos adecuadamente, generar parámetros de interés para el posterior análisis, y en general ajustar toda la información disponible al desarrollo del proyecto. Por otro lado, teniendo en cuenta el impacto y valoración cuantitativa del proyecto, se puede afirmar que el proceso propuesto representa un ahorro de aproximadamente 400 millones de pesos anuales, ya que se propone no consultar información externa a la entidad, sino que hacer un uso adecuado de la información disponible internamente. Adicionalmente, se espera que tenga impacto en el número de transacciones aprobadas anualmente, aumentándolas en aproximadamente 96 mil transacciones, lo que genera un incremento de los intereses corrientes generados por dichas transacciones, el cual se espera este alrededor de los 400 mil millones de pesos. Dentro del desarrollo del presente trabajo de grado se identificaron algunos puntos susceptibles a mejoras, que en usos futuros pueden contribuir a mejorar el desarrollo de proyectos de este tipo, dentro de la organización. En primer lugar, sería pertinente hacer una limpieza más sofisticada de la información que entra al almacén de datos y estandarizar las consultas para el descargue de la información, ya que se espera que las bases de datos disponibles garanticen la calidad y la veracidad de los datos, y que además pueda ser utilizada por cualquier usuario de la entidad en menos tiempo y con mayor facilidad. En segundo lugar, es importante estandarizar la información relacionada con los MCC, pues no se tiene una clasificación clara de los tipos de establecimientos internacionales, y en los establecimientos comerciales nacionales los códigos únicos no describen con claridad la clasificación de los grupos. Finalmente, se propone como continuidad del presente trabajo de grado, extender el análisis considerando características como: (i) la identificación específica del tipo de cliente, es decir, analizar por separado los clientes con tarjetas de crédito amparadas, extendidas y principales, pues el presente análisis agrupó y tuvo en cuenta únicamente las características del cliente principal; (ii) el tipo de tarjeta, es decir, analizar el portafolio de productos de cada cliente, teniendo en cuenta las franquicias y los segmentos de las tarjetas de crédito con las que cuenta éste cuenta; y (iii) la segmentación por colores desarrollada por el área de Investigación de Clientes del Banco Davivienda S.A., las cuales miden características de comportamiento y trayectoria del cliente dentro de la entidad. Cabe destacar que la información anteriormente mencionada, aunque está disponible dentro de la entidad, no hizo parte del alcance del presente proyecto. 95 GLOSARIO DE TÉRMINOS • ACIERTA: Acierta es un modelo estadístico basado en el comportamiento y hábito de pago histórico de las personas naturales, brindando a las entidades suscritas a DataCrédito conocer la probabilidad de que sus clientes incurran en mora de 90 días en los próximos 12 meses. Ofrece como beneficios: la agilización del proceso de aprobación de créditos, centraliza las decisiones y políticas de crédito, controla el riesgo de crédito y reduce los costos de evaluación (DataCrédito, 2011). • Autorización Transaccional o extra cupo: Porcentaje o monto de dinero que se le autoriza a un tarjetahabiente, en un momento determinado, para que la transacción de compra, pago de bienes y/o servicios o avance, no sea rechazada. • Autorizador: El autorizador es la persona encargada de tramitar las transacciones de la tarjeta de crédito cuando en el comercio no se cuenta con un datafono en red. Esta autorización se hace a través del teléfono, comunicándose directamente con la red dueña de la tarjeta de crédito. • Avance: Monto de dinero en efectivo que el banco emisor o establecimiento de crédito otorga a una persona, a través de su tarjeta de crédito. Este valor es descontado de su cupo disponible y tiene un costo adicional por la transacción. En ocasiones, el interés asociado a este tipo de transacción es diferente al de una compra o pago y tiene una tasa un poco más alta. • Banca Empresarial: Conjunto de clientes de una entidad bancaria que se caracterizan por ser personas jurídicas (empresas). • Banca Personal: Conjunto de clientes de una entidad bancaria que se caracterizan por ser personas naturales. • Bancarización: Se entiende por bancarización el grado de uso del sistema financiero en las transacciones entre los diversos agentes económicos; es decir, no sólo la apertura de cuentas de ahorro o depósitos, sino el uso de toda la gran gama de servicios que ofrece el sistema financiero (Inga, 2008). • Bridge o Puente de Red: Dispositivo para la interconexión de redes locales. • Calificación: Determina el comportamiento de pago del cliente en el sistema bancario (BANCO DAVIVIENDA S.A., 2010). • Cartera de créditos: Es el conjunto de documentos que amparan los activos financieros o las operaciones de financiamiento hacia un tercero y que el tenedor de dicho (s) documento (s) o cartera se reserva el derecho de hacer valer las obligaciones estipuladas en su texto (Definicion.org). 96 • Cartera Improductiva: Total del saldo de créditos que se encuentran vencidos a la fecha de corte más el total de créditos que no generan utilidades por intereses (no pago). • Castigo de cartera: Se refiere a una provisión de cartera, dentro de un proceso contable o fiscal, mediante el cual se estipula que los dineros que adeudan los clientes al establecimiento de crédito, no se van a recuperar. Esto implica que el establecimiento de crédito asuma estos castigos de cartera, como un gasto adicional dentro de sus operaciones (Gerencie.com, 2011). • Compañía de Financiamiento Comercial: Según la normatividad financiera las Compañías de Financiamiento Comercial - CFC- son establecimientos de crédito que al igual que los bancos se encuentran vigilados por la Superintendencia Financiera de Colombia y sus captaciones se encuentran amparadas por el Fondo de Garantías de Instituciones Financieras a través del seguro de depósito. El Estatuto Orgánico del Sistema Financiero las define como instituciones financieras que captan recursos mediante depósitos a término con el objeto de realizar operaciones de crédito que facilitan la comercialización de bienes y servicios y la realización de operaciones de arrendamiento financiero o leasing (ASOCIACIÓN DE COMPAÑÍAS DE FINANCIAMIENTO COMERCIAL, 2009). • Compra: Transacción en la cual se intercambian bienes por dinero. • Corporación Financiera: Según el estatuto financiero, son Corporaciones Financieras aquellas corporaciones que tienen por función principal la captación de recursos a término por medio de depósitos de instrumentos de deudas de plazo, con el fin de realizar operaciones activas de crédito y efectuar inversiones, cuyo objeto primordial es fomentar o promover la creación, reorganización, fusión, transformación y expansión de empresas en los sectores que establezcan las normas que regulan su actividad (BusinessCol.com, 2011). • Cruce: Los cruces hacen referencia a la combinación de dos o más bases de datos, con el fin de obtener información que se encuentra disponible en todas las bases de datos. Los programas utilizados para llevar a cabo el manejo y los cruces de las bases de datos fueron Microsoft Access, Microsoft Excel y SPSS PASW Statistics 18.0. • Cupo o Valor Máximo Asignado (VMA): Monto máximo total de dinero asignado por parte de un establecimiento de crédito o establecimiento financiero a un cliente en un crédito, después de haber analizado su perfil de crédito. • Davivienda.com (canal de internet): Sitio en internet para que desde cualquier lugar del mundo y a cualquier hora, los clientes puedan realizar sus transacciones y acceder a información de forma inmediata de los productos y servicios. A través de la página Internet, se pueden: realizar transacciones (consultas de saldos, movimientos, fechas de pago, cuotas a pagar, extractos, etc.; pagos de crédito de Davivienda, servicios públicos y privados; pagos automáticos, transferencias (entre cuentas de Davivienda, entre productos propios y a otras entidades financieras), bloqueos y activaciones (bloqueo de cuenta, activación Tarjeta de Crédito, activación clave Internet, activación de chequera y Tarjeta Débito), 97 personalización (programar el pago periódico de los productos, programar las transferencias, asignar un nombre a los productos); obtener información institucional y de los productos y servicios; conocer los puntos de atención (oficinas y cajeros); comunicarse con Davivienda (atención al cliente: quejas, sugerencias, reclamos); obtener asesoría acerca de los productos y servicios de Davivienda; conocer las últimas noticias (novedades); realizar compras en el exterior con cargo a la Tarjeta de Crédito Davivienda MasterCard y recibirlas en la puerta de la casa; realizar compras en Colombia con cargo a su Cuenta de Ahorros o Corriente; entre muchas otras consultas y transacciones (DAVIVIENDA S.A., 2006). • Datáfono: Dispositivo compacto que se instala en un establecimiento comercial con el fin de permitirle a los clientes el pago de bienes y servicios a través de las tarjetas de crédito y/o débito. • Declinación: Transacción de compra o avance que no pudo ser culminada con éxito debido a causas relacionadas con el manejo y control de una tarjeta de crédito. • Días de mora: Total de días en las que un cliente no ha cumplido con una obligación crediticia. • Endeudamiento: Utilización de recursos de terceros, a través de la modalidad de crédito, para financiamiento de actividades u operaciones. • Franquicia: Dentro de los modelos de negocio que se manejan entre las empresas, la franquicia implica que una empresa otorga licencias, para que otra pueda usar su marca y pueda prestar sus servicios. En el caso específico del Banco Davivienda S.A. se manejan las franquicias con Visa, MasterCard y Diners. • Host: Computador conectado a una red, que provee y utiliza servicios de ella. Los usuarios deben utilizar hosts para tener acceso a la red. En general, los hosts son computadores monousuario o multiusuario que ofrecen servicios de transferencia de archivos, conexión remota, servidores de base de datos, servidores web, etc. Los usuarios que hacen uso de los hosts pueden a su vez pedir los mismos servicios a otras máquinas conectadas a la red. De forma general un host es todo equipo informático que posee una dirección IP y que se encuentra interconectado con uno o más equipos (Wikipedia, 2011). • Instituciones Oficiales Especiales: Son aquellos que dentro de su marco de política definida para la colocación de crédito, orientan su portafolio de productos y servicios hacía los renglones económicos considerados como sectores en desarrollo y que como tal merecen una atención específica por parte de los programas de gobierno. Algunas instituciones oficiales especiales: Bancoldex, Findeter, la FEN, Finagro, Fogafin, el Fondo Nacional del Ahorro, entre otras (Knol, 2009). • Interés Corriente: Interés cobrado por el establecimiento bancario en el momento de corte, por el uso de un producto específico. En este caso el interés corriente hace referencia al interés que recauda el banco por la prestación de su producto de tarjeta de crédito. • Interés de Mora: Interés cobrado por el establecimiento bancario a sus clientes, por el no pago oportuno de sus obligaciones. 98 • Microcrédito: Se entiende como el sistema de financiamiento a las microempresas, donde el monto máximo por operación de crédito es de 25 SMLV. Así mismo se estipula que la principal fuente de pago de estos créditos, debe provenir de los ingresos derivados de las actividades realizadas por las microempresas (SUPERINTENDENCIA FINANCIERA DE COLOMBIA, 2005). • Microempresa: Unidad de producción en la cual hay un máximo de 10 trabajadores empleados y hasta 500 SMLV de capital (Delgado Wiesner & Parra Escobar, 2007). • Leasing: Contrato mediante el cual una parte entrega a la otra un activo para su uso y goce, a cambio de un canon periódico, durante un plazo convenido, a cuyo vencimiento, el bien se restituye a su propietario o se transfiere al usuario, si este último decide ejercer una opción de adquisición que, generalmente, se pacta a su favor (FEDELEASING). • Organismos Cooperativos de Orden Superior: Se constituyen por conjuntos de fuerzas sociales que se organizan en forma asociativa identificadas por prácticas autogestionarias, solidarias, democráticas y humanistas, sin ánimo de lucro para el desarrollo integral del ser humano sujeto y actor de la economía, cuyo fin radica en satisfacer las necesidades de sus asociados, de prestar servicios y de contribuir a su desarrollo en lo social, cultural y económico. Están compuestas en principio, por las cooperativas de primer grado y otras personas jurídicas sin ánimo de lucro (Knol, 2009). • Pérdida esperada: Valor total que se calcula se va a dejar de ganar en el momento de otorgar un crédito a un cliente determinado. Su cálculo es el producto entre la probabilidad de incumplimiento del cliente con el crédito otorgado, la pérdida dado el incumplimiento (en el momento en que el cliente no cumpla con su obligación) y el saldo o exposición del crédito. • Provisión: Monto de dinero que se destina como sistema de cubrimiento del riesgo, el cual permite absorber las pérdidas esperadas derivadas de la exposición de los créditos. • Relay: Frame Relay o (Frame-mode Bearer Service). Técnica de comunicación mediante retransmisión de tramas para redes de circuito virtual. Consiste en una forma simplificada de tecnología de conmutación de paquetes que transmite una variedad de tamaños de tramas o marcos para datos, perfecto para la transmisión de grandes cantidades de datos. La técnica Frame Relay se utiliza para un servicio de transmisión de voz y datos a alta velocidad que permite la interconexión de redes de área local separadas geográficamente a un coste menor (Wikipedia, 2011). • Sucursal bancaria: Oficina física de atención al cliente donde el cliente puede realizar las transacciones asociadas a los productos que tiene con un determinado establecimiento bancario. • Saldo o Exposición del Crédito: Valor total que adeuda un cliente en su tarjeta de crédito, después de haber realizado los pagos correspondientes en un tiempo determinado, es decir, el valor adeudado a la fecha de corte. 99 • Tarjeta de crédito: Es un instrumento de pago que permite el uso de un cupo de crédito rotativo para la adquisición de bienes y servicios en establecimientos afiliados a redes a nivel mundial, pago de impuestos, avances en efectivo en cajero automático o en las oficinas del banco, por medio de un plástico otorgado por el Banco Davivienda S.A., con un número único de tarjeta que identifica el negocio (BANCO DAVIVIENDA S.A., 2010). • Tarjetahabiente: Persona que posee una o varias tarjetas de crédito con alguna entidad de crédito. • Tarjeta de crédito amparada: Es la tarjeta que se otorga a la persona que el cliente con tarjeta principal desee, amparando el crédito hasta por el 50% del cupo de la tarjeta principal (BANCO DAVIVIENDA S.A., 2010). • Tarjeta de crédito principal: Es la tarjeta que se otorga al cliente titular del contrato con el Banco Davivienda S.A (BANCO DAVIVIENDA S.A., 2010). • Tarjeta de crédito vigente: Las tarjetas vigentes a la fecha de corte hacen referencia a las tarjetas de crédito que están activas con la entidad. Esto no implica que transen en los mercados. • Teléfono rojo: Es un servicio cómodo, fácil y rápido que le permite a sus clientes realizar operaciones durante las veinticuatro horas del día, sin moverse de su casa o lugar de trabajo. Al ingresar al Teléfono Rojo de Davivienda, el cliente marca el número de Cédula o Número de Producto (Cuenta de Ahorros, Corriente, Tarjeta de Crédito o Crédito) y la clave para el teléfono Rojo, y obtiene automáticamente los saldos de sus productos del portafolio financiero; y luego podrá seleccionar las opciones para realizar: Consultas, Pagos, Transferencias, Bloqueo y Activaciones y Servicios Especiales (DAVIVIENDA S.A., 2006). • Ticket promedio: Valor promedio de las transacciones facturadas por los tarjetahabientes. 100 BIBLIOGRAFÍA • • • • • • • • • • • • • • • Adriaans, P., & Zantinge, D. (1996). Data Mining. Harlow, Inglaterra: Adisson Wesley -longman. ALCE INGENIERÍA. (Enero de 2001). La Regresión Logística. Recuperado el 17 de Marzo de 2011, de http://www.seh-lelha.org/pdf/rlogis1.pdf Alvarado Valencia, J. A. (01 de noviembre de 2011). Conglomerado de K medias. (P. Beltrán Herrera, Entrevistador) Arbeláez, M. A., & Nieto, A. (2006). MERCADO DE TARJETAS EN COLOMBIA Y EL DEBATE SOBRE LA TARIFA DE INTERCAMBIO. FEDESARROLLO, Bogotá. ASOCIACIÓN DE COMPAÑÍAS DE FINANCIAMIENTO COMERCIAL. (2009). ¿Qué es una Compañía de Financiamiento Comercial? Recuperado el 24 de Agosto de 2011, de AFIC: http://www.afic.com.co/index.php?option=com_content&task=section&id=2&Itemid=5 BANCO DAVIVIENDA S.A. (2010). ACIERTA 2010. Informe de Seguimiento, Banco Davivienda S.A., Departamento de Monitoreo de Medios de Pago, Bogotá. BANCO DAVIVIENDA S.A. (2010). Requerimiento_Extracupos_Autorizador_Jun-30-2010. Bogotá. Bellotti, T., & Crook, J. (2008). Support vector machines for credit scoring and discovery of significant features. Expert Systems with Applications, 3302. Bernal García, J. J., Martínez María- Dolores, S. M., & Sánchez García, J. F. (2003). Universidad Politécnica de Cartagena. Recuperado el 27 de Octubre de 2011, de MODELIZACIÓN DE LOS FACTORES MÁS IMPORTANTES QUE CARACTERIZAN UN SITIO EN LA RED: http://www.uv.es/asepuma/XII/comunica/bernal_martinez_sanchez.pdf BusinessCol.com. (2011). Corporaciones Financieras. Recuperado el 24 de Agosto de 2011, de http://www.businesscol.com/empresarial/sistemfin/corpfin.htm Carbonell Asíns, J. A. (22 de Septiembre de 2011). Descubrir la Sociedad. Recuperado el 30 de Octubre de 2011, de Análisis de Clúster en SPSS: http://descubrirlasociedad.com/2011/09/analisisde-cluster-en-spss/ Cera Bilbao, C., & Maya Quintero, C. (2009). PROYECTO DE DESARROLLO DE UN MODELO DINÁMICO DE PREDICTIBILIDAD PARA LA CANCELACIÓN VOLUNTARIA DE TARJETAS DE CRÉDITO DE LAS MARCAS DINERS, VISA Y MASTERCARD EN EL BANCO DAVIVIENDA S.A. Bogotá, Colombia. Cuellar, M. M. (2008). Avances y los obtáculos de la bancarización en Colombia. Recuperado el 24 de Marzo de 2011, de https://www.bmi.gob.sv/pls/portal/docs/PAGE/BMI_HTMLS/BMI_PULSO_MYPE_IMG/BANCARIZACI ON_COLOMBIA.PDF Curso de Introducción y Manejo Básico del SPSS. (s.f.). Recuperado el 30 de Octubre de 2011, de Técnicas de Análisis Multivariante, Clasificación y Disponibilidad en SPSS: http://www.uam.es/personal_pdi/economicas/eva/pdf/intro1.pdf DataCrédito. (2011). ACIERTA. Recuperado el 24 de Agosto de 2011, de DataCrédito Virtual: http://www.datacredito.com.co/wpsv6/wps/portal/!ut/p/c0/04_SB8K8xLLM9MSSzPy8xBz9CP0os_jQA PNQX3MPIwMLMy8XAyNjy9Agf7NgY_cAE_2CbEdFAMRuPDo!/?WCM_GLOBAL_CONTEXT=/wps/ 101 • • • • • • • • • • • • • • • • • • wcm/connect/DataCredito/empresas_pages/solucionesamc/solucionesadquisicion/adquis_adriesgo_ ac DATAPRIX. (02 de Enero de 2007). Metodología CRISP- DM para Minería de Datos. Recuperado el 16 de Marzo de 2011, de http://www.dataprix.com/introducci%C3%B3n-crisp-dm DAVIVIENDA S.A. (2006). Davivienda.com. Recuperado el 17 de Marzo de 2011, de Tarjetas de Crédito: https://linea.davivienda.com/davivienda.jsp DAVIVIENDA S.A. (2006). Davivienda.com. Recuperado el 24 de Agosto de 2011, de Teléfono Rojo: https://linea.davivienda.com/opencms/opencms/davivienda/puntosAtencion/telefonoRojo.html DAVIVIENDA S.A. (2006). Davivienda.com. Recuperado el 24 de Agosto de 2011, de https://linea.davivienda.com/opencms/opencms/davivienda/puntosAtencion/daviviendaCom.html DAVIVIENDA S.A. (2009). Flujo de Transacciones Tarjetas de Crédito. Presentación Comité, Banco Davivienda S.A., Departamento de Medios de Pago, Bogotá. DAVIVIENDA S.A. (2010). Davivienda. Recuperado el 18 de Marzo de 2011, de https://linea.davivienda.com/davivienda.jsp DAVIVIENDA S.A. (2011). Informe Gerencial de Tarjetas de Crédito. Informe Mensual corte junio 2011, Banco Davivienda S.A., Unidad de Inteligencia de Negocios de la Vicepresidencia de Medios de Pago, Bogotá. DAVIVIENDA S.A. (2011). Metodologías de Calificación de Carteras. Banco Davivienda S.A., Departamento de Riesgo de Crédito, Bogotá. DAVIVIENDA S.A. (s.f.). Historia del Banco Davivienda S.A. Recuperado el 18 de Marzo de 2011, de https://linea.davivienda.com/opencms/export/sites/default/davivienda/infoGeneral/GobiernoCorporativ o/GobiernoCorporativo/HISTORIA_-_FINAL.pdf Definicion.org. (s.f.). Definición de Cartera de Crédito. Recuperado el 24 de Agosto de 2011, de http://www.definicion.org/cartera-de-credito Delgado Wiesner, C., & Parra Escobar, E. (Junio de 2007). CARACTERIZACIÓN DE LA MICROEMPRESA DE PUNTA - INFORME FINAL. Recuperado el 28 de Junio de 2011, de http://www.microempresa.com.co/.../Resumenejecutivo(microempresadepunta).doc Dinero.com. (11 de Mayo de 2011). La bancarización en Colombia llego al 62%. Dinero.com, http://www.dinero.com/actualidad/economia/articulo/la-bancarizacion-colombia-llego-62/119116. Donato, J. M., Schryver, J. C., Hinkel, G. C., Schmoyer Jr., R. L., Leuze, M. R., & Grandy, N. W. (1999). Mining multi-dimensional data for decision support. Future Generation Computer Systems, 9. FEDELEASING. (s.f.). Federación Colombiana de Compañías de Leasing. Recuperado el 24 de Agosto de 2011, de Leasing en Colombia: http://www.fedeleasing.org.co/generales.htm Gerencie.com. (2011). ¿Cómo se castiga la cartera? Recuperado el 24 de Marzo de 2011, de http://www.gerencie.com/como-se-castiga-la-cartera.html Gondar, J. E. (2010). José Huerta Consultoria de Información. Recuperado el 15 de Marzo de 2011, de Introducción a la Minería de Datos: http://www.josebhuerta.com/datamining.htm#3 Hair, J. F. (1999). Análisis Multivariante. Madrid, España: Pearson Education. http://iie.fing.edu.uyl. (30 de Noviembre de 2000). Recuperado el 20 de Marzo de 2011, de http://iie.fing.edu.uy/ense/asign/recpat/material/tema3_00-01/node25.html 102 • • • • • • • • • • • • • • • • • • Inga, P. (2008). Instituto del Perú. Recuperado el 24 de Agosto de 2011, de Bancarización: http://www.institutodelperu.org.pe/index.php?option=com_content&task=view&id=977&Itemid=130 Knol. (2009). knol, A unit of knowledge. Recuperado el 24 de Agosto de 2011, de INSTITUCIONES OFICIALES ESPECIALES: http://knol.google.com/k/an%C3%B3nimo/instituciones-oficialesespeciales/t0cbkj3hgk0d/1# Kubski, M. I. (2004). MINERÍA DE DATOS. Recuperado el 21 de Septiembre de 2011, de http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/MineriaDatosKub.pdf Lee, T.-S., Chiu, C.-C., Chou, Y.-C., & Lu, C.-J. (2004). Mining the customer credit using classification and regression tree and multivariate adaptive regression splines. Computaional Statistics & Data Analysis, 18. Ngai E.W.T, X. L. (2009). Application of data mining techniques in customer relationship management: A literature review and classification. Expert Systems with Applications, 2592-2602. Niea, G., Chenb, Y., Zhanga, L., & Guoc, Y. (2010). Credit card customer analysis based on panel data clustering. Procedia Computer Science, 2489. Pascual, D., Pla, F., & Sánchez, S. (s.f.). Algoritmos de Agrupamiento. Recuperado el Marzo19 de 2011, de http://marmota.dlsi.uji.es/WebBIB//papers/2007/1_Pascual-MIA-2007.pdf Peña Ayala, A. (2006). Tecnologías de la Información: Su Alineamiento al Negocio de las Organizaciones . Recuperado el 21 de Septiembre de 2011, de : http://www.wolnm.org/apa/articulos/Tecnologias_Informacion.pdf?target= Pita Fernández, S., & Pértega Díaz, S. (2001). Significancia Estadística. Recuperado el 29 de Abril de 2011, de http://www.fisterra.com/mbe/investiga/signi_estadi/signi_estadi.asp REVISTA SEMANA. (02 de Mayo de 2011). Las 100 empresas más grandes de Colombia (...y las 900 siguientes). (P. S. S.A., Ed.) SEMANA, 272-288. Sinnexus. (2007). Recuperado el 20 de Marzo de 2011, de http://www.sinnexus.com/business_intelligence/datamining.aspx SOCIEDADES BOLÍVAR. (s.f.). SOCIEDADES_BOLÍVAR. Recuperado el 17 de Marzo de 2011, de https://www.sociedadesbolivar.com.co SPSS Inc. (2006). SPSS Preparación de datos 15.0. Recuperado el 20 de Octubre de 2011, de https://www.u-cursos.cl/ingenieria/2010/1/IN540/1/material_docente/bajar?id_material=272742 SUPERINTENDENCIA FINANCIERA DE COLOMBIA. (Octubre de 2005). Circular Externa 035 de 2005. Recuperado el 24 de Marzo de 2011, de http://www.superfinanciera.gov.co/ SUPERINTENDENCIA FINANCIERA DE COLOMBIA. (31 de Mayo de 2011). Establecimientos de Crédito - Reporte de Tarjetas de Crédito. Recuperado el 18 de Julio de 2011, de http://www.superfinanciera.gov.co/ SUPERINTENDENCIA FINANCIERA DE COLOMBIA. (07 de Julio de 2011). Superintendencia Financiera de Colombia. Recuperado el 28 de Julio de 2011, de http://superfinanciera.gov.co/ Šušteršic, M., Mramor, D., & Zupan, J. (2008). Consumer credit scoring models with limited data. Expert Systems with Applications, 4736. Universidad Complutense de Madrid. (s.f.). Capítulo 21. Análisis de conglomerados (I): El procedimiento Conglomerados de K medias. Recuperado el 10 de Noviembre de 2011, de http://www.ucm.es/info/socivmyt/paginas/D_departamento/materiales/analisis_datosyMultivariable/21 conglk_SPSS.pdf 103 • • • Vicente Villardón, J. L. (s.f.). Introducción al Análisis de Clúster. Recuperado el 30 de Octubre de 2011, de http://biplot.usal.es/ALUMNOS/CIENCIAS/2ESTADISTICA/MULTIVAR/cluster.pdf Wikipedia. (04 de Julio de 2011). Frame Relay. Recuperado el 2011 de Agosto de 2011, de Wikipedia, la enciclopedia libre: http://es.wikipedia.org/wiki/Frame_Relay Wikipedia. (08 de Julio de 2011). Host. Recuperado el 24 de Agosto de 2011, de Wikipedia, la enciclopedia libre: http://es.wikipedia.org/wiki/Host 104 ANEXOS 105 2.936.453 2.284.179 1.913.635 1.482.192 1.169.163 1.072.872 924.605 747.528 716.158 609.462 606.302 573.664 534.519 NOMBRE ENTIDAD BANCOLOMBIA DAVIVIENDA BANCO DE BOGOTÁ BBVA OCCIDENTE BANCO POPULAR RED MULTIBANCA COLPATRIA BCSC CITIBANK LEASING BANCOLOMBIA BANAGRARIO BANCO AV VILLAS HELM BANK PUESTO 1 2 3 4 5 6 7 8 9 10 11 12 13 INGRESOS DE INTERESES 2010 (8,8) (5,8) (15,4) (19,8) (18,4) (16,5) 2,8 (7,3) 0,8 (19,1) (20,0) (1,7) (15,8) VAR (%) 106 120.355 144.047 301.682 200.003 164.478 146.039 186.178 352.220 389.471 420.394 781.811 516.665 1.177.999 UTILIDAD NETA 2010 (5,3) 30,4 (19,0) 33,0 (25,2) 144,9 22,1 16,0 8,0 15,1 6,9 13,2 17,8 VAR (%) 9.822.622 6.939.537 14.660.900 7.883.524 8.207.339 8.019.158 10.002.692 12.638.330 17.561.403 22.085.046 37.363.723 28.236.894 48.678.983 ACTIVOS 50,1 15,0 16,6 14,0 13,6 12,7 16,8 16,5 24,2 16,7 29,4 14,0 19,0 VAR (%) 7.063.046 5.187.302 5.998.579 5.085.816 4.204.236 4.325.241 7.563.719 8.336.333 11.214.448 14.490.668 21.354.626 19.819.439 32.812.578 CARTERA DE CRÉDITOS Y OPERACIONES DE LEASING 56,4 5,3 6,4 7,1 16,6 (9,0) 20,4 26,1 44,2 24,5 20,9 22,1 32,4 VAR (%) 1.421.149 1.693.122 6.952.000 569.972 2.228.949 2.708.960 1.062.973 2.924.406 3.796.677 3.371.442 10.834.944 4.066.216 6.967.972 INVERSIONES 2010 5,5 33,7 44,5 26,0 8,7 107,7 (4,5) 7,1 0,4 (19,6) 75,2 (2,0) 2,2 VAR (%) 1.087.245 837.760 1.212.419 816.429 1.428.306 889.909 999.501 1.680.457 2.592.623 2.253.623 5.156.366 3.568.562 7.816.995 PATRIMONIO 2010 Fuente: Superintendencia Financiera de Colombia en Revista Semana. 02 de Mayo de 2011. Edición 1513. Edición Especial. Las 100 Empresas más Grandes de Colombia (… y las 900 siguientes). Variaciones calculadas con respecto al año 2009. CIFRAS EN MILLONES DE PESOS ANEXO A. Las 50 Entidades Financieras de Colombia. Tomado de Revista Semana, Edición 1513, páginas 274 y 275. 6,2 14,0 8,0 15,9 13,7 18,0 15,8 27,3 33,6 11,4 29,7 31,3 12,2 VAR (%) 421.483 284.464 257.088 GNB SUDAMERIS FINDETER BANCOLDEX FONDO NACIONAL DEL AHORRO 177.481 133.877 107.997 101.880 92.366 66.733 66.722 66.004 62.497 61.617 36.138 32.571 32.139 CÍA. DE FINANCIAMIENTO TUYA (Antes Sufinanciamiento) FINAGRO BANCAMIA HSBC FINANDINA GMAC LEASING BOLÍVAR FINAMERICA SERFINANSA CONFINANCIERA L CORFICOLOMBIANA CMR FALABELLA CORFICOLOMBIANA INTERNACIONAL LEASING BANCOLDEX 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 152.219 161.352 183.020 INVERSORA PICHINCHA 220.293 430.216 BANCO SANTANDER 19 18 14 15 16 17 (9,7) (23,6) 326,5 23,9 (18,8) (11,0) (16,7) 66,1 (22,4) (35,7) (8,2) (32,7) 26,2 (46,8) (55,4) (9,9) 2,5 (31,7) (26,2) 13,6 (15,9) 107 3.134 751 535.914 15.617 13.092 15.825 10.168 5.654 15.016 28.702 26.536 (73.372) 16.110 60.854 37.531 21.242 60.543 98.821 27.025 109.058 96.804 (13,0) 6,4 (18,6) 119,9 2,8 161,9 (16,5) 214,1 46,3 239,8 71,0 357.411 240.375 6.000.583 536.874 604.495 416.683 574.261 361.542 663.976 760.173 835.215 2.069.063 720.606 > 1000% (51,4) 5.794.928 761.522 1.164.554 4.373.468 5.546.339 4.812.320 8.301.585 6.715.894 (14,1) 25,3 179,6 (66,1) 34,1 3,2 16,4 19,3 17,1 (8,0) 1,4 77,7 (0,3) (9,3) 0,8 91,3 (21,2) (8,5) 17,6 33,5 23,7 9,4 (62,0) (4,9) 10,0 (1,8) 8,4 13,8 20,4 300.921 177.381 - 491.321 521.404 357.263 487.892 320.209 556.902 674.857 713.828 1.315.688 604.691 5.028.504 655.692 1.003.473 2.686.218 4.610.447 4.267.609 3.459.714 4.466.417 15,0 (4,2) N/A 87,7 3,7 4,0 2,4 110,5 (16,4) (8,7) 20,9 31,7 28,6 11,8 (61,8) (0,4) 16,9 16,9 6,1 6,1 19,4 8.311 17.320 4.676.818 3.655 11.516 21.049 23.236 10.657 23.432 10.208 30.500 414.307 954 560.259 891 43.616 1.459.741 725.229 278.713 3.926.762 1.236.318 13,6 9,4 12,1 7,1 (52,6) (24,5) (11,7) 4,1 (62,4) (9,4) (49,3) 69,4 (68,3) 10,8 .98,5 (20,9) 16,4 63,4 68,6 19,1 17,9 32.047 31.683 2.733.762 85.377 71.471 70.833 71.934 61.639 97.829 192.666 134.318 252.815 186.688 546.696 128.922 184.029 1.782.439 1.382.338 804.990 599.182 700.800 10,8 2,3 9,0 37,2 1,3 18,0 5,6 60,9 14,2 16,4 16,2 39,8 9,6 3,2 (40,0) 13,4 3,5 3,5 3,6 12,9 8,7 50 44 45 46 47 48 49 43 35 36 37 38 39 40 41 42 815 768 462 FNG FONADE WWB S.A. (Banco Mundial de la Mujer) 5.154 SCOTIA BANK COLOMBIA (Antes RBS Bank) 851 13.179 MACROFINANCIERA CIT CAPITA 20.391 GIROS Y FINANZAS 1.587 21.233 COOPCENTRAL MI PLATA S.A. 22.671 DANN REGIONAL 3.253 22.915 PROCREDIT FOGACOOP 25.702 FACTORING BANCOLOMBIA 3.467 26.023 FEN JP MORGAN 26.115 COLTEFINANCIERA N/A 25,2 (70,2) (37,1) N/A (14,1) (53,1) (79,2) 71,3 (17,9) 18,8 (25,5) 59,5 (54,4) (45,0) (29,9) 108 307 2.309 9.023 428 (1.493) 5.507 7.052 (21.650) (3.960) 3.772 10.863 400 (9.175) 4.574 51.526 (1.900) N/A (84,3) 194,0 (43,5) N/A (74,4) (69,6) (239,4) 8,8 5,4 (12,0) 104,7 29,1 115,7 (55,7) (38,2) 70.462 997.928 496.420 18.244 168.986 341.219 736.824 358.219 153.577 212.151 373.935 240.112 189.050 545.920 315.501 456.209 N/A (13,7) 8,4 4,2 N/A 8,3 38,0 (26,8) 89,5 (1,1) 15,3 9,1 60,9 6,9 (13,1) 22,6 - - - 3.230 - - - 99.612 123.081 132.834 249.352 205.709 140.772 397.707 3.208 368.328 N/A N/A N/A (25,9) N/A N/A N/A (24,8) 149,3 10,7 48,3 22,4 70,4 1,5 (43,2) 27,1 - 584.483 444.850 - 51 243.505 426.493 172.152 2.520 22.140 84.289 8.731 15.601 32.093 287.491 19.230 N/A (23,1) 11,5 N/A N/A (2,1) 27,6 (25,3) 70,9 (41,1) (10,9) (44,9) 551,6 45,7 (13,2) (13,5) 70.307 102.194 288.589 17.558 14.938 558.838 335.641 117.718 13.214 35.007 173.004 32.205 32.862 45.308 289.441 49.757 N/A (2,5) 3,1 2,5 N/A (20,9) 2,1 (15,2) (31,5) 5,5 4,6 12,7 (10,6) 4,0 14,1 (4,6) TOTAL ESTABLECIMIENTOS DE CREDITO 271 221 408.316 71 4.018 2.893 113.676 44.597 32.316 80.990 33.821 4.339 2.747 40.484 17.595 3.702 2.312 24.755 Bloqueadas temporalmente 109 40.264 66.513 194 1.921 4.799 2.812.108 51.162 17.515 BANCO AGRARIO DE COLOMBIA AV VILLAS COOMEVA CMR FALABELLA BANCO PICHINCHA GIROS Y FINANZAS TUYA S.A. LA POLAR 14.585 5.804 315 929 4.901 5.413 642 253 4.682 354 1.818 877 8.971 Canceladas 14 621.819 RED MULTIBANCA COLPATRIA 3.158 156 1.923 6.354 8.677 225 33 8.699 1.133 3.861 857 14.737 Vigentes durante el mes 662 360.698 64.444 71.682 307.271 238.939 41.344 11.783 191.040 43.733 169.817 53.069 567.130 BANCO BOGOTA BANCO POPULAR SANTANDER BANCOLOMBIA CITIBANK HSBC GNB SUDAMERIS BBVA COLOMBIA HELM BANK DE OCCIDENTE BCSC BANCO CAJA SOCIAL DAVIVIENDA Vigentes a la fecha de corte CREDIBANCO - VISA ANEXO B. Informe Tarjetas de Crédito. Superintendencia Financiera de Colombia. Mayo 2011. 13.362 684 3.710 807 11.517 123.840 24.348 231.586 32.780 434.813 61.133 322 322 2.071.069 5.548 137.688 6.121 1.931 6.877 5.186 146 86.553 327.741 174.633 22.796 325.402 4.922 Vigentes durante el mes 148.567 Vigentes a la fecha de corte 29.166 14 2.252 2.535 1.429 263 3.342 1.610 6.512 1.075 4.802 2.690 353 2.289 Canceladas 303.788 26.211 62.593 32.299 31.756 68.666 13.663 2.966 40.335 12.568 1.212 11.519 Bloqueadas temporalmente NÚMERO DE TARJETAS DE CREDITO MASTERCARD 26.729 1.154.718 35.711 2.800.867 17.523 710.136 604.038 234.872 10.803 6.337 Vigentes a la fecha de corte 573 26.682 4.034 71.092 1.785 23.660 7.319 6.965 14 60 210 4.156 9 23.238 152 2.140 9.971 6.451 29 120 Canceladas OTRAS TARJETAS Vigentes durante el mes 2.469 320.955 505 470.409 1 106.660 10.764 28.609 446 Bloqueadas temporalmente Numero Monto total Compras 110 Monto total 2.092.064 733.014.175.818 163.899 47.791.244.321 17.701 7.685.182.532 18.687 11.785.311.915 707.417 212.407.132.422 109.492 54.867.814.368 13.754 11.449.453.155 4.099 2.903.462.326 114.650 38.670.287.123 14.135 7.984.303.929 96.578 33.162.696.822 55.693 13.712.018.666 240.486 167.238.813.290 167.834 34.162.815.552 12.881 3.495.850.146 60.414 14.418.964.746 9.910 6.527.537.001 23.270 9.366.913.000 258 65.910.000 0 0 260.906 55.318.464.504 0 0 Numero 851.498 63.506 3.105 22.022 299.740 110.916 14.800 4.065 27.562 31.533 61.333 7.002 143.510 53.172 351 8.666 0 0 215 0 0 0 Numero 238.098.734.208 21.987.397.686 1.004.435.960 6.340.154.653 84.960.896.487 26.918.510.794 5.061.185.546 1.712.239.600 7.889.498.178 11.448.140.942 14.788.168.512 1.343.004.919 39.605.102.491 12.786.485.566 114.610.555 2.065.741.626 0 0 73.160.692 0 0 0 Monto total 13.960 794 103 119 6.792 1.741 280 349 651 299 767 94 1.558 264 18 128 0 0 3 0 0 0 Numero TOTAL TRANSACCIONES POR COMPRAS Y AVANCES A nivel nacional En el exterior Avances Compras BANCO BOGOTA 635.209 128.564.094.974 BANCO POPULAR 53.877 8.136.949.744 SANTANDER 208.650 57.739.528.205 BANCOLOMBIA 1.969.173 392.766.658.076 CITIBANK 636.724 119.061.742.175 HSBC 131.756 24.018.197.385 GNB SUDAMERIS 47.153 12.222.249.259 BBVA COLOMBIA 290.949 51.313.565.631 HELM BANK 231.543 57.440.711.794 DE OCCIDENTE 569.994 97.523.101.743 BCSC BANCO CAJA SOCIAL 188.908 30.980.686.478 DAVIVIENDA 1.839.823 366.690.643.954 RED MULTIBANCA COLPATRIA 1.487.726 192.250.670.102 BANCO AGRARIO DE COLOMBIA 39.089 5.143.810.858 AV VILLAS 163.860 25.763.395.518 COOMEVA 3.930 572.296.469 CMR FALABELLA 926.653 126.847.829.616 BANCO PICHINCHA 1.706 348.446.126 GIROS Y FINANZAS 15.545 1.915.918.847 TUYA S.A. 687.876 88.938.101.054 LA POLAR 13.934 2.830.278.762 TOTAL ESTABLECIMIENTOS DE 10.144.078 1.791.068.876.771 CREDITO Fuente: Formato 466 " Reporte mensual de tarjetas de crédito y débito" ESTABLECIMIENTOS DE CREDITO REPORTE DE TARJETAS DE CREDITO Fecha de corte: Mayo de 2011 Cifras en pesos 7.073.479.224 329.737.622 37.167.089 39.615.764 2.767.720.644 708.244.521 124.255.273 101.408.036 242.247.640 148.503.087 1.921.231.589 18.357.687 513.899.525 68.425.882 11.697.512 40.044.740 0 0 922.613 0 0 0 Monto total Avances BANCO BOGOTA BANCO POPULAR SANTANDER BANCOLOMBIA CITIBANK HSBC GNB SUDAMERIS BBVA COLOMBIA HELM BANK DE OCCIDENTE BCSC BANCO CAJA SOCIAL DAVIVIENDA RED MULTIBANCA COLPATRIA BANCO AGRARIO DE COLOMBIA AV VILLAS COOMEVA CMR FALABELLA BANCO PICHINCHA GIROS Y FINANZAS TUYA S.A. LA POLAR COOFINEP TOTAL ESTABLECIMIENTOS DE CREDITO ESTABLECIMIENTOS DE CREDITO REPORTE DE TARJETAS DE CREDITO Fecha de corte: Mayo de 2011 Cifras en pesos 9.171.888.386 171.934.894.759 111 438.796.733 39.174.988 165.527.533 940.411.144 2.363.435.277 77.628.656 21.696.787 307.176.367 80.415.155 306.948.891 258.574.975 2.087.179.837 1.049.793.248 33.787.948 65.892.268 0 378.363.896 1.776.374 5.154.898 530.862.782 19.290.630 0 De mora 14.066.259.476 1.179.334.213 4.232.056.078 29.816.859.987 10.671.153.205 2.794.707.229 378.307.914 11.167.493.284 2.455.474.312 9.686.217.817 2.939.924.128 34.107.271.664 19.904.332.501 867.490.569 2.647.937.854 697.373.892 8.625.269.330 23.757.766 158.402.160 15.319.395.496 195.875.884 0 Corrientes Intereses por compras y avances 82.255.553.411 8.036.091.397 145.774.997 0 34.105.945 613.617.141 231.825.076 130.463.850 0 30.037.459 90.962.006 65.079.527 67.325.689 502.284.503 5.277.750.698 0 20.845.769 10.416.502 15.173.791 0 0 800.428.442 0 0 Conceptos diferentes a capital Castigos de cartera 3.296.339.156 0 908.896.006 13.197.884.228 4.310.664.020 1.173.741.873 0 1.340.901.614 995.492.486 1.555.844.917 933.964.520 9.473.445.512 38.889.833.198 0 694.238.346 172.404.672 471.337.459 0 0 4.840.565.403 0 0 Capital TOTAL INTERESES Y CASTIGOS DE CARTERA 438.796.733 39.174.988 165.527.533 940.411.144 2.363.435.277 77.628.656 21.696.787 307.176.367 80.415.155 306.948.891 258.574.975 2.087.179.837 1.049.793.248 33.787.948 65.892.268 0 378.363.896 1.776.374 5.154.898 530.862.782 19.290.630 0 9.171.888.386 171.934.894.759 De mora 14.066.259.476 1.179.334.213 4.232.056.078 29.816.859.987 10.671.153.205 2.794.707.229 378.307.914 11.167.493.284 2.455.474.312 9.686.217.817 2.939.924.128 34.107.271.664 19.904.332.501 867.490.569 2.647.937.854 697.373.892 8.625.269.330 23.757.766 158.402.160 15.319.395.496 195.875.884 0 Corrientes 112 82.255.553.411 3.296.339.156 0 908.896.006 13.197.884.228 4.310.664.020 1.173.741.873 0 1.340.901.614 995.492.486 1.555.844.917 933.964.520 9.473.445.512 38.889.833.198 0 694.238.346 172.404.672 471.337.459 0 0 4.840.565.403 0 0 Capital 8.036.091.397 145.774.997 0 34.105.945 613.617.141 231.825.076 130.463.850 0 30.037.459 90.962.006 65.079.527 67.325.689 502.284.503 5.277.750.698 0 20.845.769 10.416.502 15.173.791 0 0 800.428.442 0 0 Conceptos diferentes a capital TOTAL INTERESES Y CASTIGOS DE CARTERA Intereses por compras y avances Castigos de cartera Fuente: Formato 466 " Reporte mensual de tarjetas de crédito y débito" BANCO BOGOTA BANCO POPULAR SANTANDER BANCOLOMBIA CITIBANK HSBC GNB SUDAMERIS BBVA COLOMBIA HELM BANK DE OCCIDENTE BCSC BANCO CAJA SOCIAL DAVIVIENDA RED MULTIBANCA COLPATRIA BANCO AGRARIO DE COLOMBIA AV VILLAS COOMEVA CMR FALABELLA BANCO PICHINCHA GIROS Y FINANZAS TUYA S.A. LA POLAR COOFINEP TOTAL ESTABLECIMIENTOS DE CREDITO ESTABLECIMIENTOS DE CREDITO REPORTE DE TARJETAS DE CREDITO Fecha de corte: Mayo de 2011 Cifras en pesos TOTAL ESTABLECIMIENTOS DE CREDITO BANCO BOGOTA BANCO POPULAR SANTANDER BANCOLOMBIA CITIBANK HSBC GNB SUDAMERIS BBVA COLOMBIA HELM BANK DE OCCIDENTE BCSC BANCO CAJA SOCIAL DAVIVIENDA RED MULTIBANCA COLPATRIA BANCO AGRARIO DE COLOMBIA AV VILLAS COOMEVA CMR FALABELLA BANCO PICHINCHA GIROS Y FINANZAS TUYA S.A. LA POLAR COOFINEP ESTABLECIMIENTOS DE CREDITO REPORTE DE TARJETAS DE CREDITO Fecha de corte: Mayo de 2011 Cifras en pesos 113 12.309.334.430.462 976.075.246.991 77.331.994.945 272.607.058.551 1.880.460.911.050 1.254.756.927.709 188.540.831.210 34.372.671.132 645.362.742.350 187.753.534.797 482.716.819.384 190.274.035.354 2.311.763.875.420 2.004.161.437.133 53.706.655.919 174.419.819.825 45.814.244.923 590.819.694.534 1.490.778.124 9.203.063.001 912.971.558.244 14.730.259.330 270.538 Saldo de tarjeta de crédito 23.505.982.391.810 1.353.288.115.227 110.916.828.234 702.177.023.045 5.076.721.785.832 1.934.421.929.627 358.244.609.962 81.289.201.634 1.145.426.678.839 557.399.623.203 1.986.942.604.819 252.010.043.832 4.465.534.160.799 2.577.634.225.433 73.697.065.623 236.131.344.788 70.983.024.381 1.797.692.063.207 3.233.636.505 13.922.615.073 683.695.034.276 24.620.777.470 0 Cupo de crédito no utilizado TOTAL SALDOS CARTERA ANEXO C. Variables disponibles en el almacén de datos del Banco Davivienda S.A. La mayoría de la información del cliente con la que cuenta el almacén de datos del Banco Davivienda S.A. es recopilada a través de los formularios de Solicitud de Crédito que se encuentran disponibles en las sucursales bancarias. En seguida se presenta la estructura de los dos tipos formularios que actualmente están disponibles, tanto como para persona natural como para persona jurídica. SOLICITUD DE CRÉDITO PERSONA NATURAL SOLICITUD DE CRÉDITO PERSONA JURÍDICA 1. Productos a solicitar: Crediexpress fijo, Crediexpress rotativo, Tarjeta de crédito, Cuenta Corriente sin Sobregiro, Préstamo liquidez, Crédito de Vehículo, Crédito Hipotecario. Información del vendedor. 2. Información del primer solicitante: Información persona natural, Localización, Actividad Laboral, Información Financiera, Finca raíz, Vehículo, Activos y Pasivos, Referencias, Operaciones internacionales y autorización de desembolso. 3. Información del segundo solicitante / amparado / adicional / cónyuge / codeudor / deudor solidario: Se solicita la misma información que al primer solicitante. 4. Información para tarjeta joven / crédito universitario. 1. Productos a solicitar: Crediexpress fijo, Crediexpress rotativo, Tarjeta de crédito, Crédito de vehículo, Crédito hipotecario. Información del vendedor. 2. Información de la empresa: Información básica persona jurídica, localización, información financiera, finca raíz, vehículo, relaciones financieras, referencias comerciales, operaciones internacionales, vinculación con otras empresas del grupo, funcionarios autorizados. 5. Información tarjetas convenios de clubes y colegios. 3. Autorizaciones y declaraciones. 6. Autorizaciones y declaraciones. 114 La información que está disponible en el Almacén de Datos del Banco Davivienda puede clasificarse en: (i) Información del cliente (demográfica) e (ii) Información transaccional del cliente (comportamiento del cliente). A continuación se presenta una lista de algunas de las variables que se pueden encontrar dentro del Almacén de datos, de acuerdo con esta clasificación. CAMPOS TIPO_IDENTIFICACION LUGAR_NACIMIENTO FECHA_NACIMIENTO SEXO ESTADO_CIVIL ACTIVIDAD_ECONOM/ OCUPACIÓN / PROFESIÓN / NIVEL DE EDUCACIÓN / ACTIVIDAD LABORAL NACIONALIDAD NUM_PER_CARGO ESTADO_PERSONA HOBBY ANTIGUEDAD_LABORAL INDICADOR_VIVIENDA / TIPO DE INMUEBLE DATOS DEMOGRÁFICOS DEL CLIENTE SEGMENTO ESTRATO FUNCIONARIO_PUB (tipo de funcionario) TIPO_EMPRESA FECHA_ACTUALIZACION PERIODO TIPO_IDENTIFICACION SEDE TIPO_EMPRESA / CLASE DE EMPRESA ACTIVIDAD_ECONOM NRO_EMPLEADOS FECHA_CREACION / VIGENCIA EMPRESA VINCULACION_EMPRESARIAL NRO_SOCIOS SEGMENTO SECTOR_ECONOMICO SUBSECTOR_ECONOMICO IND_FILIALES IND_NEG_NACIONAL IND_NEG_INTERNACIONAL FECHA_ACTUALIZACION SUELDO/ INGRESOS/ ACTIVOS/ INGRESOS LIQ/ RENTA LIQUIDA EGRESOS / PASIVOS/ OBLIGACIONES IND_VEHICULO OPERAC_INTER VALOR_ARRI_CUOTA CREDITO_BANC FECHA_ACTUALIZACION PROBABILIDAD DE INCUMPLIMIENTO CALIFICACIÓN DEFINITIVA p.calificacion, 115 CAMPOS DISPONIBLES COMPORTAMIENTO DEL CLIENTE CAMPO BUSCADO PROMEDIO DE CAPITAL FACTURADO MENSUALMENTE IDENTIFICACIÓN DEL PRODUCTO IDENTIFICACIÓN DEL TIPO DE ESTABLECIMIENTO PROMEDIO DEL CAPITAL PAGADO MENSUALMENTE TOTAL DE CUPO APROBADO EN TC PROMEDIO DE CUPO DISPONIBLE PROMEDIO DE DÍAS EN MORA PROMEDIO DE CUPO DISPONIBLE PARA AVANCES FECHA PRIMER AVANCE FECHA PRIMERA COMPRA CAPITAL_FACTURADO_MES capital_facturado, p.cap_facturado, COD_PRODUCTO TIPO DE TARJETA CADENA_ESTABLECIMIENTO CATEGORIA_COMERCIO capital_pagado_mes, CUPO_APROBADO CUPO_DISPONIBLE DIAS_MORA p.dias_mora, DISPONIBLE_AVANCE_TC FECHA_1A_AVANCE FECHA_1A_COMPRA FECHA_ACTIVACION FECHA_APERTURA FECHA_EMISION EDAD DEL PRODUCTO FECHA DE CANCELACIÓN DEL PRODUCTO EDAD DE LA MORA ÚLTIMA FACTURACIÓN FECHA_CANCELACION fecha_ingreso_mora, FECHA_ULT_FACTURACION fecha_ult_pago_interes, fecha_ult_pago_ktal, FECHA_VENCIMIENTO int_cte_caus_mes, interes_cte_facturado, INT_FACTURADO_MES interes_pagado_mes, mora_facturada, MORA_FACTURADA_MES n_veces_improductividad, p.nro_veces_improductivo, nivel_de_riesgo, ÚLTIMOS PAGOS FECHA VENCIMIENTO TC PROMEDIO DE INTERÉS CAUSADO MENSUALMENTE PROMEDIO DE MORA FACTURADA NO. DE VECES DE IMPRODUCTIVIDAD RIESGO NO. DE CUOTAS CANCELADAS nro_cuotas_cancela, NRO_CUOTAS_MORA nro_cuotas_mora, NO. DE CUOTAS EN MORA 116 NO. DE REESTRUCTURACIONES LUGAR DE ACTIVACIÓN PROMEDIO DE INGRESOS / VALOR DE LA CUOTA DE PROMEDIO DE CUPO EN SOBREGIRO PROMEDIO DE PREPAGOS PROMEDIO DE SALDO DISPONIBLE PROMEDIO DEL SALDO DE UTLIZACIONES PROMEDIO DE PAGO MÍNIMO PROMEDIO DE PAGO TOTAL PROMEDIO SALDO A FAVOR PROMEDIO SALDO AVANCES nro_reestruct, NRO_REESTRUCTURACIONES OFICINA_ACTIVACION p.cap_prod_cta_manejo, p.vr_cuota_manejo, p.cupo_sobregiro, p.vr_pago_anticipado, p.vr_saldo_disponible, p.vr_saldo_utilizaciones, PAGO_MINIMO PAGO_TOTAL SALDO_A_FAVOR SALDO_AVANCES SALDO_CAPITAL SALDO_CAPITAL_EMPLEADOS COMPORTAMIENTO DEL CLIENTE PROMEDIO SALDO CAPITAL PROMEDIO SALDO DE CAPITAL EN MORA PROMEDIO SALDO TOTAL EN COMPRAS PROMEDIO SALDO CUOTA DE MANEJO PROMEDIO CUOTA DE MANEJO IMPRODUCTIVA PROMEDIO SALDO DE SEGUROS SALDO_CAPITAL_MORA SALDO_COMPRAS saldo_cuota_manejo, saldo_cuota_manejo_i mpr, saldo_de_seguros, SALDO_INT_CTE_ACTIVO SALDO_INT_EXTRACONT SALDO_INT_MORA saldo_intereses_ctes, PROMEDIO SALDOS DE INTERESÉS PROMEDIO SALDO EN MORA DE CAPITAL PROMEDIO SALDO OTROS CARGOS PROMEDIO SALDO SEGUROS PROMEDIO SEGUROS FACTURADOS VALOR PRIMERA COMPRA VALOR PRIMER AVANCE PROMEDIO AVANCES MENSUALES PROMEDIO COMPRAS MENSUALES PROMEDIO DE VALOR EN MORA PROMEDIO VALOR DE REESTRUCTURACIÓN ÚLTIMA REESTRUCTURACIÓN sal do_mora_capital, SALDO_OTROS_CARGOS SALDO_SEGUROS seguros_facturados, VALOR_1A_AVANCE VALOR_1A_COMPRA VALOR_AVANCES_MES VALOR_COMPRAS_MES VALOR_MORA_PROM valor_reestruct, VALOR_ULT_REESTRUCTURACION 117 ANEXO D. Descripción de los MCC codificados. De acuerdo con la información que el Banco Davivienda S.A. tiene disponible acerca de los establecimientos en los cuales se registran las transacciones a través de las tarjetas débito y crédito entregadas a sus tarjetahabientes, se identificaron los siguientes 112 grupos de establecimientos, y a cada uno de ellos se les asigno un código único que los identifica, para poder llevar a cabo el análisis propuesto en el presente trabajo de grado. CÓDIGO MCC 0 DESCRIPCIÓN GENERAL DE LA AGRUPACIÓN DE ESTABLECIMIENTOS SIN NOMBRE 742 CLINICAS VETERINARIAS Y SERVICIOS VETERINARIOS 763 ALMACENES DE EQUIPOS, INSUMOS y SERVICIOS AGROPECUARIOS 780 VIVEROS Y ALMACENES PARA JARDINERIA 1111 AEROLINEAS 1234 OUTLETS 1520 CONTRATISTAS GENERALES - RESIDENCIALES Y COMERCIALES 4111 TRANSPORTE DE PASAJEROS, TERRESTRE, FLUVIAL y MARITIMO 4119 SERVICIOS DE AMBULANCIA 4215 SERVICIOS DE MENSAJERIA, CORREO y ENCOMIENDAS 4444 COMPRAS EN INTERNET 4511 COMPAÑIAS DE AVIACION 4722 AGENCIAS DE VIAJE y OPERADORES DE TURISMO 4789 TRANSPORTE DE CARGA EN GENERAL 4812 VENTA DE EQUIPOS Y SERVICIOS DE TELECOMUNICACIONES. 4899 SUSCRIPCION T.V POR CABLE Y OTROS SERVICIOS DE RADIO Y TELEVISION PAGOS 5045 COMPUTADORES - EQUIPOS - ACCESORIOS - SOTFWARE 5192 SUSCRIPCION Y VENTA DE PERIODICOS Y REVISTAS 5211 DEPOSITO DE MATERIALES DE CONSTRUCCION 5231 ALMACENES DE VIDRIOS Y ESPEJOS 5251 FERRETERIAS 5311 ALMACENES POR DEPARTAMENTO SIN SUPERMERCADO 5331 ALMACENES DE MISCELANEAS, CACHARRERIA Y ARTICULOS PARA REGALO / TODO TIPO DE ALMACENES 118 CÓDIGO MCC DESCRIPCIÓN GENERAL DE LA AGRUPACIÓN DE ESTABLECIMIENTOS 5411 SUPERMERCADOS / TIENDAS EXPRESS 5422 SALSAMENTARIAS y VENTAS DE CARNES 5441 DULCERIAS 5462 PANADERIAS, REPOSTERIAS, SALONES DE TE Y CAFETERIAS 5499 ALMACEN POR DEPARTAMENTO CON SUPERMERCADO 5511 VENTA DE VEHICULOS AUTOMOTORES Y MOTOCICLETAS 5532 SERVITECAS Y LLANTAS 5533 REPUESTOS Y ACCESORIOS AUTOMOTRICES 5541 ESTACIONES DE SERVICIO ( Venta de Gasolina y gas vehicular) 5551 VENTA DE BOTES Y ACCESORIOS PARA ACTIVIDADES ACUATICAS 5651 ALMACENES DE VESTUARIO Y ACCESORIOS PARA TODA LAFAMILIA 5661 ALMACENES DE CALZADO 5697 SASTRES, MODISTAS, CLINICAS DE ROPA 5712 MUEBLES PARA EL HOGAR y OFICINA 5713 ALMACEN DE TAPETES, ALFOMBRAS Y PISOS 5714 ALMACENES DE COLGADURAS, TAPICERIA Y CUBIERTAS PARA VENTANAS 5719 ALMACENES DE ARTICULOS PARA EL HOGAR 5722 ALMACENES DE ELECTRODOMESTICOS Y GASODOMESTICOS 5732 ALMACENES DE VENTA DE EQUIPOS ELECTRONICOS 5733 ALMACENES DE MUSICA - INSTRUMENTOS MUSICALES, PIANOS, PARTITURAS 5734 ALMACENES DE COMPUTADORES Y SOFTWARE 5735 ALMACENES DE DISCOS 5811 EVENTOS, FIESTAS Y BANQUETES 5812 RESTAURANTES, PIZZERIAS, FUENTES DE SODA 5813 BARES, TABERNAS, DISCOTECAS 5814 VENTA DE COMIDA RAPIDA 5912 DROGUERIAS, FARMACIAS, TIENDAS NATURISTAS 5921 CIGARRERIAS Y LICORERAS 5932 ALMACENES DE ARTICULOS TIPICOS, ANTIGUEDADES ( Ventas, Reparación y Restauración) / PINTURAS / MUSEOS / ARTE 5940 ALMACEN DE BICICLETAS VENTA Y SERVICIOS 5941 ALMACENES DE ARTICULOS DEPORTIVOS 5942 LIBRERIAS 119 CÓDIGO MCC DESCRIPCIÓN GENERAL DE LA AGRUPACIÓN DE ESTABLECIMIENTOS 5943 PAPELERIAS ( Almacenes de Artículos para Oficina y colegios 5944 ALMACENES DE RELOJES, JOYAS Y PLATERIAS 5945 ALMACENES DE JUEGOS, JUGUETES Y HOBBIES 5946 ALMACENES DE CAMARAS Y EQUIPOS FOTOGRAFICOS 5948 ALMACENES DE ARTICULOS DE CUERO Y MALETAS 5949 ALMACENES DE TELAS 5960 MERCADEO DIRECTO - SERVICIOS DE SEGUROS 5966 MERCADEO DIRECTO - COMERCIANTES DE VENTAS TELEFONICAS / DIRECTV 5968 MERCADEO DIRECTO - COMERCIANTES DE VENTAS TELEFONICAS / AMWAY 5971 GALERIAS DE ARTE - MARQUETERIAS 5975 VENTA DE ARTICULOS MEDICOS, ODONTOLOGICOS, ORTOPEDICOS 5977 PERFUMERIAS y TIENDA DE COSMESTICOS 5983 DISTRIBUIDORES DE MATERIALES PARA COMBUSTIBLE, CARBON, ACEITE COMBUSTIBLE PETROLEO LIQUIDO, MADERA. 5992 FLORISTERIAS 5995 ALMACENES DE MASCOTAS - ALIMENTOS Y ACCESORIOS PARA MASCOTAS 5999 PRODUCTOS QUIMICOS 6010 ENTIDADES FINANCIERAS 6300 ASEGURADORAS 6513 INMOBILIARIAS 7011 HOTELES - CENTROS VACACIONALES 7033 MOTELES y AMOBLADOS 7210 LAVANDERIAS - LAVASECOS 7230 SALONES DE BELLEZA - PELUQUERIAS 7261 SERVICIOS FUNERARIOS Y PARQUES CEMENTARIOS 7296 ALQULER DE VESTIDOS y DISFRACES 7298 GIMNASIOS, SAUNA, BAÑOS TURCOS y CENTROS DE ESTETICA 7299 GRILES -WISKERIAS- NIGT CLUB -STRIP TEASE, 7311 SERVICIOS DE PUBLICIDAD, MEDIOS Y ARTES GRAFICAS 7338 SERVICIIOS DE REPRODUCCCION Y FOTOCOPIAS 7349 ADMINISTRACION DE AREAS COMUNES, SERVICIOS DE LIMPIEZA, MANTENIMIENTO Y CELADURIA 120 CÓDIGO MCC DESCRIPCIÓN GENERAL DE LA AGRUPACIÓN DE ESTABLECIMIENTOS 7392 SERVICIOS Y ASESORIAS PROFESIONALES 7393 AGENCIAS DE PROTECCIÓN Y SERVICIOS DE SEGURIDAD 7399 INSUMOS INDUSTRIALES 7512 COMPAÑIAS DE ALQUILER DE VEHICULOS 7523 GARAJES Y PARQUEADEROS 7538 TALLERES DE MECANICA Y LATONERIA Y PINTURA Y SERVICIIOS DE GRUA 7622 ALMACENES DE REPARACIONES ELECTRONICAS 7699 ALMACENES DE REPARACION DE ARTICULOS ELECTRICOS 7832 SALAS DE CINE 7841 TIENDAS DE ALQUILER DE VIDEOS 7922 AGENCIAS DE BOLETERIA ( Producciones de Teatro ) excepto cine 7995 CASINOS Y JUEGOS DE AZAR , LOTERIAS, RIFAS 7997 CLUBES SOCIALES Y DEPORTIVOS 7999 SERVICIOS DE RECREACION 8011 CONSULTORIOS Y SERVICIOS MEDICOS 8043 OPTICAS Y ARTICULOS OPTICOS 8062 CLINICAS - HOSPITALES 8071 LABORATORIOS CLINICOS 8099 MEDICINA PREPAGADA 8220 COLEGIOS, UNIVERSIDADES , INSTITUTOS DE EDUCACION TECNOLOGICA Y PREESCOLAR 8299 ESCUELAS DE ENSEÑANZA INFORMAL 8398 ORGANIZACIONES DE SERVICIO SOCIAL y DE CARIDAD 8699 ASOCIACIONES PROFESIONALES Y GREMIOS 8999 CONGRESOS Y SEMINARIOS 9311 PAGO DE IMPUESTOS / PAGOS DE TDC 9399 SERVICIOS PUBLICOS NPI NO POSEE INFORMACIÓN 121 ANEXO E. Análisis previo de los datos. El análisis previo de los datos o preparación de datos conduce a una mejor predicción y a una evaluación más precisa de la dimensión de las variables obtenidas (Hair, 1999). Esto permite obtener un conocimiento básico de los datos y las relaciones entre las variables. De esta manera, para describir el comportamiento de las transacciones declinadas por fondos insuficientes, a continuación se presenta la descripción estadística de cada una de las variables obtenidas en las bases de datos iniciales. Este análisis estadístico fue realizado con la ayuda del software PASW Statistics 18.0.27 i. • BASE DE DATOS AGRUPADA POR CLIENTE Validación de datos Se realizó la validación de los datos de la base, el cual consiste en la comprobación de un número fijo de reglas que permite determinar qué valores de cada una de las variables están fuera de los rangos. “El cuadro de diálogo Validar datos permite identificar casos, variables y valores de datos no válidos o sospechosos en el conjunto de datos activo” (SPSS Inc., 2006). Las reglas que se validaron en PASW 18.0 fueron: × × × × × × × × Porcentaje máximo de valores perdidos: 70 (se aplica a todas las variables). Porcentaje máximo de casos en una única categoría: 95 (se aplica únicamente a las variables categóricas28). Porcentaje máximo de categorías con recuento igual a 1: 90 (se aplica únicamente a las variables categóricas). Coeficiente mínimo de variación: 0,001 (se aplica únicamente a las variables de escala29). Desviación típica mínima: 0 (se aplica únicamente a las variables de escala). Marcar ID incompletos. Marcar ID duplicados. Marcar casos vacíos. Define los casos por todas las variables del conjunto excepto variables ID30. La validación de datos arrojó el siguiente resultado: (SPSS Inc., 2006) Una variable categórica es aquella que indica una categoría, una etiqueta y/o un nombre. 29 Una variable escalar es aquella que toma valores numéricos. 30 Una variable ID es aquella que indica el nombre o el caso en el que se mueven las demás variable. 27 28 122 Fuente: PASW 18.0 De lo anterior se puede concluir que: “Las variables de análisis superaron las comprobaciones básicas y no hay casos vacíos, por lo que aparece una advertencia que explica por qué no hay ningún resultado que corresponda a esas comprobaciones” (SPSS Inc., 2006). • Datos ausentes De igual manera se realizó la consulta de los posibles datos ausentes dentro de la base de datos. El análisis obtenido arrojó que de las 38 variables analizadas, ninguna de ellas presenta datos ausentes o perdidos. A continuación se presenta el resultado obtenido a través del software SPSS 18.0.31 Fuente: PASW 18.0 31 En el análisis de dato se utilizará “,” para representar decimales y “.” para representar miles. 123 Fuente: PASW 18.0 • Casos atípicos “El procedimiento de detección de anomalías busca casos atípicos basados en desviaciones de las normas de sus agrupaciones. El procedimiento está diseñado para detectar rápidamente casos atípicos con fines de auditoría de datos en el paso del análisis exploratorio de datos, antes de llevar a cabo cualquier análisis de datos inferencial. Este algoritmo está diseñado para la detección de anomalías genéricas; es decir, la definición de un caso anómalo no es específica de ninguna aplicación particular” (SPSS Inc., 2006). Sin tener en cuenta las dos variables nominales (“CALIFICACIÓN” y “MCC”), el procedimiento arrojó los siguientes resultados: Fuente: PASW 18.0 124 Lo anterior implica que se crearon dos grupos con características similares, en los cuales se indica la cantidad de datos encontrados y el porcentaje de casos en cada uno de estos. Es decir, existe un primer grupo que tiene el 86% de datos similares entre ellos y otro con el 14%. Fuente: PASW 18.0 El índice de anomalía es una medida que refleja la atipicidad del caso respecto al grupo de homólogos. En este estudio existe un caso extremo que presenta una anomalía de 110,396 mientras que existe un caso que presenta una anomalía mínima de 2,001. Lo anterior sugiere que hay una distancia significativa entre las anomalías del primer y el último caso identificado, lo que implica que posiblemente el caso con anomalía 110,396 es realmente un caso atípico. Igualmente, a continuación se presenta el gráfico de los casos atípicos agrupados en los dos grupos homogéneos identificados por el software, donde se puede ver con claridad los casos que están alejados del común de los grupos homogéneos. Fuente: PASW 18.0 125 Del gráfico anterior se puede concluir que los casos que están señalados dentro de los círculos rojos son los casos atípicos, más atípicos o los que están más alejados del grupo de homólogos. Dado el alcance y objetivo del presente trabajo se eliminarán todos los datos atípicos identificados.32 Para eliminar los casos atípicos se seleccionan los casos que tienen índice de anomalía menor a 2,001 (el menor identificado entre los casos atípicos) y mayor a 110,391 (el mayor índice de anomalía identificado). • Verificación de los supuestos del análisis multivariante Esta etapa consiste en comprobar los supuestos básicos del análisis multivariante. Esto permite que se disminuyan las distorsiones y sesgos potenciales de las variables analizadas (Hair, 1999). A continuación se presenta el análisis estadístico de las variables originales. Se realizaron pruebas de normalidad, homocedasticidad y linealidad de las variables. Muestra total: 198.015 casos. Datos atípicos: 1.508. Los datos atípicos representan el 0,77% de la población. Muestra final: 193.510. 32 126 # DE TRANSACCIONES DECLINADAS VARIABLE = . , = !. "## 127 La variable “# DE TRANSACCIONES DECLINADAS” no presenta una distribución normal, pues el valor de Z está por encima del valor crítico Zesperado = +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a la variable para disminuir la curtosis (561,454 >3; curva leptocúrtica) y asimetría (12,448 > 0; curva asimétrica positiva). Test de normalidad: = COMPORTAMIENTO TOTAL DECLINADO ($) = $,% . = ""&. '(! 128 La variable “TOTAL DECLINADO ($)” no presenta una distribución normal, pues el valor de Z está por debajo del valor crítico Zesperado = +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a la variable para disminuir la curtosis (7404,132 >3; curva leptocúrtica) y asimetría (60,606 > 0; curva asimétrica positiva). Test de normalidad: = % EXTRA CUPO = . %, = (. ))". *)#, "! 129 La variable “% EXTRA CUPO” no presenta una distribución normal, pues el valor de Z está por encima del valor crítico Zesperado = +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a la variable para disminuir la curtosis (43120,199 >3; curva leptocúrtica) y asimetría (0,006 > 0; curva asimétrica positiva). Test de normalidad: = Compuesta por las variables: FRANQUICIA RECEPTORA 130 = Test de normalidad DINERS INTERNAL: = Test de normalidad DINERS NAL: = Test de normalidad MASTER INTERNAL: = = ,%$ = &. "*" = ". &# . . $, = (. !# = −# # . %%, +,$ . = -. #") = −#-' . = = Test de normalidad MASTER NAL: = %, +,%$ . = = Test de normalidad VISA INTERNAL: = Test de normalidad VISA NAL: = % MASTER INTERNAL. % MATER NAL. % VISA INTERNAL. % VISA NAL. • • • • • • 131 porc VISA NAL: Curtosis = -1,376 < 3, curva platicúrtica. Asimetría = 0,546 > 0, curva asimétrica positiva. porc VISA INTERNAL: Curtosis = 23,048 > 3, curva leptocúrtica. Asimetría = 4,811 > 0, curva asimétrica positiva. porc MASTER NAL: Curtosis = -1,672 < 3, curva platicúrtica. Asimetría = -0,148 < 0, curva asimétrica negativa. porc MASTER INTERNAL Curtosis = 33,448 > 3, curva leptocúrtica. Asimetría = 5,714 > 0, curva asimétrica positiva. porc DINERS NAL Curtosis = 74,448 > 3, curva leptocúrtica. Asimetría = 8,279 > 0, curva asimétrica positiva. porc DINERS INTERNAL Curtosis = 85,378 > 3, curva leptocúrtica. Asimetría = 9,116 > 0, curva asimétrica positiva. Las variables “porc VISA NAL”, “porc VISA INTERNAL”, “porc MASTER NAL”, “porc MASTER INTERNAL”; “porc DINERS NAL” y “porc DINERS INTERNAL” no presentan una distribución normal, pues los valores de Z están por debajo o por encima del valor crítico Zesperado = +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a las variables para disminuir la curtosis y asimetría. % DINERS INTERNAL. % DINERS NAL. 132 = = ,$ = &"' = &"' . ,$ . • • 133 porc TRX NAL: Curtosis = 8,472 > 3, curva leptocúrtica. Asimetría = -3,130 < 0, curva asimétrica negativa. porc TRX INTERNAL: Curtosis = 8,472 > 3, curva leptocúrtica. Asimetría = 3,130 > 0, curva asimétrica positiva. Las variables “porc TRX NAL” y “porc TRX INTERNAL” no presentan una distribución normal, pues los valores de Z están por encima del valor crítico Zesperado = +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a las variables para disminuir la curtosis y asimetría. Test de normalidad TRX INTERNAL: = Compuesta por las variables: Test de normalidad TRX NAL: = TIPO DE TRANSACCIÓN Compuesta por las variables: HORARIO FRECUENTE % TRX INTERNAL % TRX NAL = = −'" = ("# = −#-& . , +, . . +, 134 Las variables “porc M” y “porc T” y “porc N” no presentan una distribución normal, pues los valores de Z están por encima o por debajo del valor crítico Zesperado = +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a las variables para disminuir la curtosis y asimetría. = = Test de normalidad M: = Test de normalidad M: = Test de normalidad M: = %N %T %M • • • 135 porc M: Curtosis = -0,508 < 3, curva platicúrtica. Asimetría = 0.969 > 0, curva asimétrica positiva. porc T: Curtosis = -1,412 < 3, curva platicúrtica. Asimetría = -0,324 < 0, curva asimétrica negativa. porc N: Curtosis = 4,009 > 3, curva leptocúrtica. Asimetría = 2,229 > 0, curva asimétrica positiva. Compuesta por las siguientes variables: DÍA FRECUENTE = Test de normalidad SÁBADO: = 136 = = Test de normalidad VIERNES: = Test de normalidad JUEVES: = . . , . %,$ = #&# = ('- =( " = ("( = (*- = '!' = (- . %,% . , . ,% %, . ,$ = = = = Test de normalidad MIÉRCOLES: = Test de normalidad MARTES: = Test de normalidad LUNES: = Test de normalidad DOMINGO: = % LUNES % DOMINGO • • • • • • • 137 porc DOMINGO: Curtosis = 3,600 > 3, curva leptocúrtica. Asimetría = 2,171 > 0, curva asimétrica positiva. porc LUNES: Curtosis = 4,478 > 3, curva leptocúrtica. Asimetría = 2,315 > 0, curva asimétrica positiva. porc MARTES: Curtosis = 4,352 > 3, curva leptocúrtica. Asimetría = 2,291 > 0, curva asimétrica positiva. porc MIÉRCOLES: Curtosis = 4,029 > 3, curva leptocúrtica. Asimetría = 2,224 > 0, curva asimétrica positiva. porc JUEVES: Curtosis = 3,953 > 3, curva leptocúrtica. Asimetría = 2,213 > 0, curva asimétrica positiva. porc VIERNES: Curtosis = 3,794 > 3, curva leptocúrtica. Asimetría = 2,173 > 0, curva asimétrica positiva. porc SÁBADO: Curtosis = 1,894 > 3, curva leptocúrtica. Asimetría = 1,767 > 0, curva asimétrica positiva. Las variables “porc DOMINGO”, “porc LUNES”, “porc MARTES”, “porc MIÉRCOLES”, “porc JUEVES”, “porc VIERNES” y “porc SÄBADO” no presentar una distribución normal, pues los valores de Z están por encima del valor crítico Zesperado = +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a las variables para disminuir la curtosis y asimetría % VIERNES % JUEVES %MIÉRCOLES % MARTES 138 Compuesta por las siguientes variables: MES FRECUENTE % SÁBADO 139 Test de normalidad ENERO: = = . ,$ = *&! = = = Test de normalidad ABRIL: = Test de normalidad MAYO: = Test de normalidad JUNIO: = ,$$ = . = !# = #. !(( = #. #. , . , = = = #. ((# = #. (#( . . ,$% = = #) = ""- = (- = )*" = #. (&) . , . , . $,% . ,%$ = #. !)) 140 Las variables “porc ENERO”, “porc FEBRERO”, “porc MARZO”, “porc ABRIL”, “porc MAYO”, “porc JUNIO”, “porc JULIO”, “porc AGOSTO”, “porc SEPTIEMBRE”, “porc OCTUBRE”, “porc NOVIEMBRE” y “porc DICIEMBRE” no presentan una distribución normal, pues los valores de Z están por encima del valor crítico Zesperado = +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a las variables para disminuir la curtosis y asimetría. Test de normalidad DICIEMBRE: = Test de normalidad NOVIEMBRE: = Test de normalidad OCTUBRE: = = = Test de normalidad SEPTIEMBRE: = Test de normalidad AGOSTO: = ,$ . , . , = Test de normalidad MARZO: = Test de normalidad JULIO: = = Test de normalidad FEBRERO: = % FEBRERO % ENERO • • • • • • • • • • • • 141 porc ENERO: Curtosis = 10,756 > 3, curva leptocúrtica. Asimetría = 3,352 > 0, curva asimétrica positiva. porc FEBRERO: Curtosis = 12,075 > 3, curva leptocúrtica. Asimetría = 3,518 > 0, curva asimétrica positiva. porc MARZO: Curtosis = 9,940 > 3, curva leptocúrtica. Asimetría = 3,237 > 0, curva asimétrica positiva. porc ABRIL: Curtosis = 8,376 > 3, curva leptocúrtica. Asimetría = 3,023 > 0, curva asimétrica positiva. porc MAYO: Curtosis = 7,340 > 3, curva leptocúrtica. Asimetría = 2,875 > 0, curva asimétrica positiva. porc JUNIO: Curtosis = 2,048> 3, curva leptocúrtica. Asimetría = 1,854 > 0, curva asimétrica positiva. porc JULIO: Curtosis = 15,285 > 3, curva leptocúrtica. Asimetría = 3,922 > 0, curva asimétrica positiva. porc AGOSTO: Curtosis = 14,561 > 3, curva leptocúrtica. Asimetría = 3,830 > 0, curva asimétrica positiva. porc SEPTIEMBRE: Curtosis = 14,763 > 3, curva leptocúrtica. Asimetría = 3,852 > 0, curva asimétrica positiva. porc OCTUBRE: Curtosis = 12,477 > 3, curva leptocúrtica. Asimetría = 3,574> 0, curva asimétrica positiva. porc NOVIEMBRE: Curtosis = 11,465 > 3, curva leptocúrtica. Asimetría = 3,446 > 0, curva asimétrica positiva. porc DICIEMBRE: Curtosis = 5,554 > 3, curva leptocúrtica. Asimetría = 2,573 > 0, curva asimétrica positiva. % JUNIO % MAYO % ABRIL % MARZO 142 % OCTUBRE % SEPTIEMBRE % AGOSTO % JULIO 143 COMPORTAMIENTO MONTO: % DICIEMBRE % NOVIEMBRE 144 Compuesta por las siguientes variables: = Test de normalidad MONTO MÁXIMO: = = = -( . #*- . = &&". ! = #&(. #& = (!&. #*# ,$ , . . . , %$, = • • • 145 PROMEDIO DECLINACIÓN: Curtosis = 2609,098 > 3, curva leptocúrtica. Asimetría = 32,976 > 0, curva asimétrica positiva. MONTO MÍNIMO: Curtosis = 3407,819 > 3, curva leptocúrtica. Asimetría = 38,866 > 0, curva asimétrica positiva. MONTO MÁXIMO: Curtosis = 1921,114 > 3, curva leptocúrtica. Asimetría = 27,726 > 0, curva asimétrica positiva. DESVIACIÓN ESTÁNDAR: Curtosis = 8609,157 > 3, curva leptocúrtica. Asimetría = 58,861 > 0, curva asimétrica positiva. Las variables “PROMEDIO DE DECLINACIÓN”, “MONTO MÍNIMO”, “MONTO MÁXIMO” y “DESVIACIÓN ESTÁNDAR no presentan una distribución normal, pues los valores de Z están por encima del valor crítico Zesperado = +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a las variables para disminuir la curtosis y asimetría. Test de normalidad DESVIACIÓN ESTÁNDAR: = = Test de normalidad MONTO MÍNIMO : = Test de normalidad PROMEDIO DECLINACIÓN: = DESVIACIÓN ESTÁNDAR ($) MONTO MÁXIMO ($) MONTO MÍNIMO ($) PROMEDIO DE DECLINACIÓN ($) 146 CALIFICACIÓN 147 Lo anterior implica que el 89% de los clientes que registraron transacciones declinadas por fondos insuficientes tienen una calificación de riesgo A, y tan sólo el 0,7% tienen una calificación de riesgo E. MCC FRECUENTE DESCRIPCIÓN 148 5411 SUPERMERCADOS / TIENDAS EXPRESS 5499 ALMACEN POR DEPARTAMENTO CON SUPERMERCADO 5661 ALMACENES DE CALZADO 5651 ALMACENES DE VESTUARIO Y ACCESORIOS PARA TODA LAFAMILIA 0 SIN NOMBRE 5541 ESTACIONES DE SERVICIO ( Venta de Gasolina y gas vehicular) 1111 AEROLINEAS 4812 VENTA DE EQUIPOS Y SERVICIOS DE TELECOMUNICACIONES 5966 MERCADEO DIRECTO - COMERCIANTES DE VENTAS TELEFONICAS / DIRECTV 4444 COMPRAS EN INTERNET 5311 ALMACENES POR DEPARTAMENTO SIN SUPERMERCADO 5912 DROGUERIAS, FARMACIAS, TIENDAS NATURISTAS 5331 ALMACENES DE MISCELANEAS, CACHARRERIA Y ARTICULOS PARA REGALO / TODO TIPO DE ALMACENES 7011 HOTELES - CENTROS VACACIONALES 4722 AGENCIAS DE VIAJE y OPERADORES DE TURISMO 5533 REPUESTOS Y ACCESORIOS AUTOMOTRICES 8699 ASOCIACIONES PROFESIONALES Y GREMIOS 5812 RESTAURANTES, PIZZERIAS, FUENTES DE SODA 5960 MERCADEO DIRECTO - SERVICIOS DE SEGUROS 8220 COLEGIOS, UNIVERSIDADES , INSTITUTOS DE EDUCACION TECNOLOGICA Y PREESCOLAR 5511 VENTA DE VEHICULOS AUTOMOTORES Y MOTOCICLETAS 7995 CASINOS Y JUEGOS DE AZAR , LOTERIAS, RIFAS 5211 DEPOSITO DE MATERIALES DE CONSTRUCCION 5814 VENTA DE COMIDA RAPIDA 5712 MUEBLES PARA EL HOGAR y OFICINA 5942 LIBRERIAS 8011 CONSULTORIOS Y SERVICIOS MEDICOS 5532 SERVITECAS Y LLANTAS 5045 COMPUTADORES - EQUIPOS - ACCESORIOS - SOTFWARE 4511 COMPAÑIAS DE AVIACION 5941 ALMACENES DE ARTICULOS DEPORTIVOS 5732 ALMACENES DE VENTA DE EQUIPOS ELECTRONICOS 5948 ALMACENES DE ARTICULOS DE CUERO Y MALETAS 5251 FERRETERIAS MCC 37.347 24.898 18.152 13.847 13.819 10.951 8.073 5.488 5.037 4.749 4.110 2.880 2.734 2.492 2.375 2.364 2.125 2.056 1.928 1.695 1.693 1.500 1.312 1.261 1.257 1.200 1.092 993 930 901 844 799 674 651 FRECUENCIA 19,2% 12,8% 9,3% 7,1% 7,1% 5,6% 4,1% 2,8% 2,6% 2,4% 2,1% 1,5% 1,4% 1,3% 1,2% 1,2% 1,1% 1,1% 1,0% 0,9% 0,9% 0,8% 0,7% 0,6% 0,6% 0,6% 0,6% 0,5% 0,5% 0,5% 0,4% 0,4% 0,3% 0,3% % MCC FRECUENTE 149 5977 PERFUMERIAS y TIENDA DE COSMESTICOS 6300 ASEGURADORAS 8043 OPTICAS Y ARTICULOS OPTICOS 5722 ALMACENES DE ELECTRODOMESTICOS Y GASODOMESTICOS 9399 SERVICIOS PUBLICOS 763 ALMACENES DE EQUIPOS, INSUMOS y SERVICIOS AGROPECUARIOS 9311 PAGO DE IMPUESTOS / PAGOS DE TDC 1234 OUTLETS 5949 ALMACENES DE TELAS 5719 ALMACENES DE ARTICULOS PARA EL HOGAR 5968 MERCADEO DIRECTO - COMERCIANTES DE VENTAS TELEFONICAS / AMWAY 8062 CLINICAS - HOSPITALES 5422 SALSAMENTARIAS y VENTAS DE CARNES 5944 ALMACENES DE RELOJES, JOYAS Y PLATERIAS 7230 SALONES DE BELLEZA - PELUQUERIAS 7512 COMPAÑIAS DE ALQUILER DE VEHICULOS 7997 CLUBES SOCIALES Y DEPORTIVOS 7922 AGENCIAS DE BOLETERIA (Producciones de Teatro ) excepto cine 5932 ALMACENES DE ARTICULOS TIPICOS, ANTIGUEDADES (Ventas, Reparación y Restauración) / PINTURAS / MUSEOS / ARTE 742 CLINICAS VETERINARIAS Y SERVICIOS VETERINARIOS 5462 PANADERIAS, REPOSTERIAS, SALONES DE TE Y CAFETERIAS 7832 SALAS DE CINE 5946 ALMACENES DE CAMARAS Y EQUIPOS FOTOGRAFICOS 4111 TRANSPORTE DE PASAJEROS, TERRESTRE, FLUVIAL y MARITIMO 1520 CONTRATISTAS GENERALES - RESIDENCIALES Y COMERCIALES 780 VIVEROS Y ALMACENES PARA JARDINERIA 4215 SERVICIOS DE MENSAJERIA, CORREO y ENCOMIENDAS 5813 BARES, TABERNAS, DISCOTECAS 5734 ALMACENES DE COMPUTADORES Y SOFTWARE 7538 TALLERES DE MECANICA Y LATONERIA Y PINTURA Y SERVICIIOS DE GRUA 8299 ESCUELAS DE ENSEÑANZA INFORMAL 8099 MEDICINA PREPAGADA 5943 PAPELERIAS (Almacenes de Artículos para Oficina y colegios) 7298 GIMNASIOS, SAUNA, BAÑOS TURCOS y CENTROS DE ESTETICA 5975 VENTA DE ARTICULOS MEDICOS, ODONTOLOGICOS, ORTOPEDICOS 5713 ALMACEN DE TAPETES, ALFOMBRAS Y PISOS 7033 MOTELES y AMOBLADOS 5735 ALMACENES DE DISCOS 7399 INSUMOS INDUSTRIALES 4119 SERVICIOS DE AMBULANCIA 645 644 602 567 538 486 470 454 453 422 414 397 388 357 350 344 323 307 305 293 293 290 260 256 253 250 193 192 180 155 145 144 138 115 114 104 98 56 56 53 0,3% 0,3% 0,3% 0,3% 0,3% 0,2% 0,2% 0,2% 0,2% 0,2% 0,2% 0,2% 0,2% 0,2% 0,2% 0,2% 0,2% 0,2% 0,2% 0,2% 0,2% 0,1% 0,1% 0,1% 0,1% 0,1% 0,1% 0,1% 0,1% 0,1% 0,1% 0,1% 0,1% 0,1% 0,1% 0,1% 0,1% 0,0% 0,0% 0,0% MCC FRECUENTE 7261 5192 5733 6010 4789 7311 8398 5945 5231 5921 5551 5441 7392 7999 4899 7841 8071 5940 8999 5995 7523 5999 6513 5811 7299 7338 5992 7622 5714 5971 7349 7393 7699 5697 5983 7210 7296 150 SERVICIOS FUNERARIOS Y PARQUES CEMENTARIOS SUSCRIPCION Y VENTA DE PERIODICOS Y REVISTAS ALMACENES DE MUSICA - INSTRUMENTOS MUSICALES, PIANOS, PARTITURAS ENTIDADES FINANCIERAS TRANSPORTE DE CARGA EN GENERAL SERVICIOS DE PUBLICIDAD, MEDIOS Y ARTES GRAFICAS ORGANIZACIONES DE SERVICIO SOCIAL y DE CARIDAD ALMACENES DE JUEGOS, JUGUETES Y HOBBIES ALMACENES DE VIDRIOS Y ESPEJOS CIGARRERIAS Y LICORERAS VENTA DE BOTES Y ACCESORIOS PARA ACTIVIDADES ACUATICAS DULCERIAS SERVICIOS Y ASESORIAS PROFESIONALES SERVICIOS DE RECREACION SUSCRIPCION T.V POR CABLE Y OTROS SERVICIOS DE RADIO Y TELEVISION PAGOS TIENDAS DE ALQUILER DE VIDEOS LABORATORIOS CLINICOS ALMACEN DE BICICLETAS VENTA Y SERVICIOS CONGRESOS Y SEMINARIOS ALMACENES DE MASCOTAS - ALIMENTOS Y ACCESORIOS PARA MASCOTAS GARAJES Y PARQUEADEROS PRODUCTOS QUIMICOS INMOBILIARIAS EVENTOS, FIESTAS Y BANQUETES GRILES -WISKERIAS- NIGT CLUB -STRIP TEASE, SERVICIIOS DE REPRODUCCCION Y FOTOCOPIAS FLORISTERIAS ALMACENES DE REPARACIONES ELECTRONICAS ALMACENES DE COLGADURAS, TAPICERIA Y CUBIERTAS PARA VENTANAS GALERIAS DE ARTE - MARQUETERIAS ADMINISTRACION DE AREAS COMUNES, SERVICIOS DE LIMPIEZA, MANTENIMIENTO Y CELADURIA AGENCIAS DE PROTECCIÓN Y SERVICIOS DE SEGURIDAD ALMACENES DE REPARACION DE ARTICULOS ELECTRICOS SASTRES, MODISTAS, CLINICAS DE ROPA DISTRIBUIDORES DE MATERIALES PARA COMBUSTIBLE, CARBON, ACEITE COMBUSTIBLE PETROLEO LIQUIDO, MADERA. LAVANDERIAS - LAVASECOS ALQULER DE VESTIDOS y DISFRACES 53 47 46 44 43 43 42 37 33 30 27 26 26 22 20 16 16 15 15 12 9 8 7 6 6 6 5 5 3 3 3 3 3 2 2 2 1 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% MCC FRECUENTE 151 Se puede concluir que los seis MCC que presentan más declinaciones por fondos insuficientes son: primero, el 5411 correspondiente a SUPERMERCADOS / TIENDAS EXPRESS, seguido por el 5499 que hace referencia a ALMACENES POR DEPARTAMENTO CON SUPERMERCADO, tercero, el 5661 correspondiente a ALMACENES DE CALZADO, seguido por el 5651 correspondiente a ALMACENES DE VESTUARIO Y ACCESORIOS PARA TODA LA FAMILA, cuarto el 5541 correspondiente a ESTACIONES DE SERVICIO (Venta de gasolina y gas vehicular) y finalmente, el 1111 correspondiente a AEROLINEAS. En el caso del MCC 0 correspondiente a establecimiento SIN NOMBRE se puede afirmar que presenta el 7,1% de la muestra. Adicionalmente, la homocedasticidad de la dependencia de las variables requiere de un análisis de la varianza o ANOVA. Este test no se realizará ya que se considera que sí las variables no presentan normalidad, es muy probable que tampoco presenten homocedasticidad. De acuerdo con lo expuesto por Hair, en su libro Análisis Multivariante: “En muchas ocasiones la heterocidasticidad es el resultado de la no normalidad de una de las variables, y la corrección de la no normalidad resuelve igualmente la dispersión de la varianza” (Hair, 1999). ii. BASE DE DATOS AGRUPADA POR MCC Este análisis no es necesario ya que después de analizar la base de datos agrupada por cliente se identificó que las variables incluidas en la base de datos agrupada por MCC, se describan a través de las variables de la base anterior. iii. • BASE DE DATOS CON INFORMACIÓN DEL PRODUCTO DE TARJETA DE CRÉDITO Validación de datos Se validaron las mismas reglas de la base anteriormente analizada con la ayuda del software PASW 18.0. La validación de datos arrojó el siguiente resultado: Fuente: PASW 18.0 De lo anterior se puede concluir que: “Las variables de análisis superaron las comprobaciones básicas y no hay casos vacíos, por lo que aparece una advertencia que explica por qué no hay ningún resultado que corresponda a esas comprobaciones” (SPSS Inc., 2006). • Datos ausentes De igual manera se realizó la consulta de los posibles datos ausentes dentro de la base de datos. El análisis obtenido arrojó que de las 3 variables analizadas, ninguna de ellas presenta datos ausentes o perdidos. A continuación se presenta el resultado obtenido a través del software SPSS 18.0. 152 Fuente: PASW 18.0 • Casos atípicos El procedimiento arrojó los siguientes resultados: Fuente: PASW 18.0 Lo anterior implica que se crearon siete grupos con características similares, en los cuales se indica la cantidad de datos encontrados y el porcentaje de casos en cada uno de estos. Es decir, existe un primer grupo que tiene el 20% de datos similares entre ellos y otros con una distribución uniforme alrededor del 14%. Fuente: PASW 18.0 El índice de anomalía es una medida que refleja la atipicidad del caso respecto al grupo de homólogos. En este estudio existe un caso extremo que presenta una anomalía de 512,892 mientras que existe un caso que presenta una anomalía mínima de 3,083. Lo anterior sugiere que hay una distancia significativa entre las 153 anomalías del primer y el último caso identificado, lo que implica que posiblemente el caso con anomalía 512,892 es realmente un caso atípico. Igualmente, a continuación se presenta el gráfico de los casos atípicos agrupados en los dos grupos homogéneos identificados por el software, donde se puede ver con claridad los casos que están alejados del común de los grupos homogéneos. Fuente: PASW 18.0 Del gráfico anterior se puede concluir que los casos que están señalados dentro de los círculos rojos son los casos atípicos, más atípicos o los que están más alejados del grupo de homólogos. Dado el alcance y objetivo del presente trabajo se eliminarán todos los datos atípicos identificados.33 Para eliminar los casos atípicos se seleccionan los casos que tienen índice de anomalía menor a 3,083 (el menor identificado entre los casos atípicos) y mayor a 512,892 (el mayor índice de anomalía identificado). • Verificación de los supuestos del análisis multivariante Esta etapa consiste en comprobar los supuestos básicos del análisis multivariante. Esto permite que se disminuyan las distorsiones y sesgos potenciales de las variables analizadas (Hair, 1999). A continuación se presenta el análisis estadístico de las variables originales. Se realizaron pruebas de normalidad, homocedasticidad y linealidad de las variables. 833 Muestra total: 195.01 casos. Datos atípicos: 9,751. Los datos atípicos representan el 5,0007% de la población. Muestra final: 185.267. 154 ESTADÍSTICOS VARIABLE 155 COMPORTAMIENTO RECENCY (meses) = +, . = − !, ') 156 La variable “RECENCY (meses)” no presenta una distribución normal, pues el valor de Z está por debajo del valor crítico Zesperado = +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a la variable para aumentar la curtosis (-0,560 >3; curva platicúrtica) y asimetría (0,92 > 0; curva asimétrica positiva). Test de normalidad: = ANTIQUITY (años) = , . = #. (-#, )" 157 La variable “ANTIQUITY (años)” no presenta una distribución normal, pues el valor de Z está por encima del valor crítico Zesperado = +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a la variable para disminuir la curtosis (14,664 >3; curva leptocúrtica) y asimetría (2,993 > 0; curva asimétrica positiva). Test de normalidad: = MONETIZE ($/año) = . $.%,$ = #. (-#, )" 158 La variable “MONETIZE ($/año)” no presenta una distribución normal, pues el valor de Z está por encima del valor crítico Zesperado = +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a la variable para disminuir la curtosis (16032,297 >3; curva leptocúrtica) y asimetría (251,144> 0; curva asimétrica positiva). Test de normalidad: = Adicionalmente, la homocedasticidad de la dependencia de las variables requiere de un análisis de la varianza o ANOVA. Este test no se realizará ya que se considera que sí las variables no presentan normalidad, es muy probable que tampoco presenten homocedasticidad. De acuerdo con lo expuesto por Hair, en su libro Análisis Multivariante: “En muchas ocasiones la heterocedasticidad es el resultado de la no normalidad de una de las variables, y la corrección de la no normalidad resuelve igualmente la dispersión de la varianza” (Hair, 1999). iv. • BASE DE DATOS DEMOGRÁFICA Validación de datos Se validaron las mismas reglas de la base anteriormente analizada con la ayuda del software PASW 18.0. La validación de datos arrojó el siguiente resultado: Fuente: PASW 18.0 De lo anterior se puede concluir que: “Las variables de análisis superaron las comprobaciones básicas y no hay casos vacíos, por lo que aparece una advertencia que explica por qué no hay ningún resultado que corresponda a esas comprobaciones” (SPSS Inc., 2006). • Datos ausentes De igual manera se realizó la consulta de los posibles datos ausentes dentro de la base de datos. El análisis obtenido arrojó que de las 4 variables analizadas, ninguna de ellas presenta datos ausentes o perdidos. A continuación se presenta el resultado obtenido a través del software SPSS 18.0. Fuente: PASW 18.0 • Verificación de los supuestos del análisis multivariante A continuación se presenta el análisis estadístico de las variables originales. 159 EDAD ESTADÍSTICOS VARIABLE 160 COMPORTAMIENTO OCUPACIÓN GÉNERO 161 ESTADO CIVIL 162 La población de tarjetahabientes que declinan sus transacciones por fondos insuficientes en su mayoría son personas entre los 36 y los 55 años, de ocupación empleados y de estado civil casados. No presenta una diferencia significativa con respecto al género de los clientes. 12,448 Asimetría Positiva 60,606 Asimetría Positiva ASIMETRÍA 0,383 Platicúrtica 1,165 Platicúrtica CURTOSIS 1,186 Asimetría Positiva -0,032 Asimetría Negativa ASIMETRÍA VARIABLE TRANSFORMADA -99,9948% -99,7925% CURTOSIS -100,053% -90,4724% ASIMETRÍA VARIACIÓN PORCENTUAL -99,959% -99,466% CURTOSIS 100% 100% ASIMETRÍA VARIACIÓN IDEAL CHECK 34 163 Se plantea esta transformación ya que la mayoría de las variables presentan comportamientos leptocúrticos y asimetrías positivas. Se aplica el logaritmo en base 10 de las variables más la unidad, ya que existen valores mínimos iguales o cercanos a 0, y la función logaritmo en base 10 no está definida para este valor [log(0/ = ∄]. 7404,132 Leptocúrtica TOTAL DECLINADO ($) CURTOSIS 561,454 Leptocúrtica VARIABLE VARIABLE INICIAL BASE AGRUPADA POR CLIENTE # DE TRANSACCIONES DECLINADAS • Una vez eliminados los casos atípicos del estudio, se procede a realizar la transformación de las variables. La transformación utilizada fue la de logaritmo en base 10 [log( + 1)] de cada una de las variables34. A continuación se presenta un resumen y descripción de éstas de acuerdo con la curtosis y la asimetría que presentaban en el escenario inicial y las presentadas después de la transformación. Adicionalmente se presenta la variación porcentual que produjo la transformación en los valores de las curtosis y las asimetrías, comparadas frente a la variación ideal (escenario en que las distribuciones fueran normales, con curtosis 3 y asimetría 0, es decir, mesocúrticas y simétricas). Finalmente, la columna “CHECK” indica cuales de las variables presentaron una variación adecuada de sus curtosis y asimetrías (se acercaron al escenario ideal: distribución normal). De acuerdo con la descripción estadística inicial de las variables, se identificó que se hace necesario transformarlas con el fin de disminuir la curtosis y la asimetría. De acuerdo con lo expuesto por Hair en su libro Análisis Multivariante, las transformaciones de los datos proporcionan un medio para modificar las variables por una o dos razones: corregir el incumplimiento de los supuestos estadísticos subyacentes de las técnicas multivariantes o mejorar la relación entre las variables. Las transformaciones de los datos proporcionan el medio principal para corregir la normalidad y la heterocedasticidad (Hair, 1999). ANEXO F. Transformación de las variables. 43120,199 Leptocúrtica -1,376 Platicúrtica 23,048 Leptocúrtica -1,672 Platicúrtica 33,448 Leptocúrtica 77,448 Leptocúrtica 85,378 Leptocúrtica 8,472 Leptocúrtica 8,472 Leptocúrtica -0,508 Platicúrtica -1,412 Platicúrtica 4,009 Leptocúrtica % EXTRA CUPO % VISA NAL % VISA INTERNACIONAL % MASTER NACIONAL % MASTER INTERNACIONAL %DINERS NAL % DINERS INTERNACIONAL % TRX NAL % TRX INTERNAL %M %T %N 0,548 Asimetría Positiva 4,811 Asimetría Positiva -0,148 Asimetría Negativa 5,714 Asimetría Positiva 8,279 Asimetría Positiva 9,116 Asimetría Positiva -3,130 Asimetría Negativa 3,130 Asimetría Positiva 0,969 Asimetría Positiva -0,324 Asimetría Negativa 2,229 Asimetría Positiva 0,006 Asimetría Positiva -0,509 Platicúrtica -0,431 Platicúrtica -1,824 Platicúrtica 4,196 Leptocúrtica 15,095 Leptocúrtica 50,488 Leptocúrtica 27,945 Leptocúrtica 15,942 Leptocúrtica -1,323 Platicúrtica 11,032 Leptocúrtica -1,865 Platicúrtica 0,341 Platicúrtica 164 -0,072 Asimetría Negativa 3,542 Asimetría Positiva -0,740 Asimetría Negativa 4,157 Asimetría Positiva 5,333 Asimetría Positiva 7,133 Asimetría Positiva -4,057 Asimetría Negativa 2,445 Asimetría Positiva 0,123 Asimetría Positiva -1,170 Asimetría Negativa 1,126 Asimetría Positiva 0,173 Asimetría Positiva -112,6964% -69,4759% 259,0551% -50,4721% 78,1752% -40,8653% -63,9177% -52,3380% -20,8732% -52,1347% 35,538% -99,9992% -49,4841% 261,1111% -87,3065% -21,8850% 29,6166% -21,7530% -35,5840% -27,2489% 400,0000% -26,3771% -113,139% 2.783,33% 100% 312,465% 100% 100% 690,551% -25,168% 100% 100% 100% 100% -64,589% -64,589% -96,486% -96,126% 100% 100% 279,426% -91,031% 100% 100% -86,984% 318,023% 4,352 Leptocúrtica 4,029 Leptocúrtica 3,953 Leptocúrtica 3,794 Leptocúrtica 1,894 Leptocúrtica 10,756 Leptocúrtica 12,075 Leptocúrtica 9,940 Leptocúrtica 8,376 Leptocúrtica 7,340 Leptocúrtica % MARTES % MIÉRCOLES % JUEVES % VIERNES % SÁBADO % ENERO % FEBRERO % MARZO % ABRIL % MAYO 1,193 Platicúrtica 1,370 Platicúrtica 1,778 Platicúrtica 2,417 Platicúrtica 2,050 Platicúrtica -1,277 Platicúrtica -0,911 Platicúrtica -0,827 Platicúrtica -0,833 Platicúrtica -0,734 Platicúrtica -0,692 Platicúrtica 2,315 Asimetría Positiva 4,478 Leptocúrtica % LUNES 2,291 Asimetría Positiva 2,224 Asimetría Positiva 2,213 Asimetría Positiva 2,173 Asimetría Positiva 1,767 Asimetría Positiva 3,352 Asimetría Positiva 3,3518 Asimetría Positiva 3,237 Asimetría Positiva 3,023 Asimetría Positiva 2,875 Asimetría Positiva -0,641 Platicúrtica 2,171 Asimetría Positiva 3,600 Leptocúrtica % DOMINGO 165 -83,7466% -83,6437% -82,1127% -79,9834% -80,9409% -167,4234% -124,0116% -120,9208% -120,6751% -116,8658% -115,4533% 1,019 Asimetría Positiva 1,000 Asimetría Positiva 0,953 Asimetría Positiva 0,956 Asimetría Positiva 0,915 Asimetría Positiva 0,711 Asimetría Positiva 1,915 Asimetría Positiva 2,003 Asimetría Positiva 1,850 Asimetría Positiva 1,744 Asimetría Positiva 1,699 Asimetría Positiva -117,8056% 1,054 Asimetría Positiva -40,9043% -42,3090% -42,8483% -40,2411% -42,8699% -59,7623% -57,8923% -56,8007% -57,1493% -56,3509% -55,9827% -51,4509% -59,128% -64,183% -69,819% -75,155% -72,109% 58,395% -20,928% -24,108% -25,540% -31,066% -33,006% -16,667% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 2,048 Leptocúrtica 15,285 Leptocúrtica 14,561 Leptocúrtica 14,763 Leptocúrtica 12,477 Leptocúrtica 11,465 Leptocúrtica 5,554 Leptocúrtica 2609,098 Leptocúrtica 3407,819 Leptocúrtica 1921,114 Leptocúrtica 8609,157 Leptocúrtica % JUNIO % JULIO % AGOSTO % SEPTIEMBRE % OCTUBRE % NOVIEMBRE % DICIEMBRE PROMEDIO DECLINACIÓN ($) MONTO MÍNIMO ($) MONTO MÁXIMO ($) DESVIACIÓN ESTÁNDAR ($) 1,854 Asimetría Positiva 3,922 Asimetría Positiva 3,830 Asimetría Positiva 3,852 Asimetría Positiva 3,574 Asimetría Positiva 3,446 Asimetría Positiva 2,573 Asimetría Positiva 32,976 Asimetría Positiva 38,866 Asimetría Positiva 27,726 Asimetría Positiva 58,861 Asimetría Positiva -1,646 Platicúrtica 0,888 Platicúrtica 8,712 Leptocúrtica 1,213 Platicúrtica 0,401 Platicúrtica 2,354 Platicúrtica 2,718 Platicúrtica 3,528 Leptocúrtica 3,621 Leptocúrtica 4,037 Leptocúrtica -0,878 Platicúrtica 166 0,957 Asimetría Positiva 2,364 Asimetría Positiva 2,277 Asimetría Positiva 2,254 Asimetría Positiva 2,077 Asimetría Positiva 1,992 Asimetría Positiva 1,457 Asimetría Positiva 0,162 Asimetría Positiva -1,293 Asimetría Negativa -0,006 Asimetría Negativa -0,441 Asimetría Negativa -100,0191% -99,9538% -99,7444% -99,9535% -92,7800% -79,4679% -78,2159% -76,1024% -75,1322% -73,5885% -142,8711% -100,7492% -100,0216% -103,3268% -99,5087% -43,3735% -42,1938% -41,8858% -41,4849% -40,5483% -39,7246% -48,3819% -99,965% -99,844% -99,912% -99,885% -45,985% -73,833% -75,956% -79,679% -79,397% -80,373% 46,484% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% VARIABLE: PROMEDIO DE DECLINACIÓN ($) HISTOGRAMA DE FRECUENCIAS CON LA CURVA NORMAL DE LA VARIABLE SIN TRANSFORMAR 167 HISTOGRAMA DE FRECUENCIAS CON LA CURVA NORMAL DE LA VARIABLE TRANSFORMADA A continuación se presenta, a manera de ejemplo, la comparación de dos variables significativas para evidenciar gráficamente la transformación obtenida en la distribución de dichas variables (valores de curtosis y asimetría) luego de aplicar el log( + 1). VARIABLE: # DE TRANSACCIONES DECLINADAS 168 -1,616 Platicúrtica -0,218 Platicúrtica 5,046 Platicúrtica 0,920 Asimetría Positiva 2,993 Asimetría Positiva 251,144 Asimetría Positiva -0,560 Platicúrtica 14,664 Leptocúrtica 76.032,297 Leptocúrtica RECENCY (meses) ATIQUITY (años) MONETIZE ($/año) -1,777 Asimetría Positiva 0,272 Asimetría Positiva 0,428 Asimetría Positiva ASIMETRÍA -99,99% -101,49% 188,57% CURTOSIS -100,71% -90,91% -53,48% ASIMETRÍA VARIACIÓN PORCENTUAL -100,00% -79,54% -635,71% CURTOSIS -100,00% -100,00% -100,00% ASIMETRÍA VARIACIÓN IDEAL CHECK 169 A continuación se presenta, a manera de ejemplo, la comparación de dos variables significativas para evidenciar gráficamente la transformación obtenida en la distribución de dichas variables (valores de curtosis y asimetría) luego de aplicar el log( + 1). CURTOSIS VARIABLE TRANSFORMADA ASIMETRÍA VARIABLE VARIABLE INICIAL BASE DE DATOS CON INFORMACIÓN DEL PRODUCTO DE TARJETA DE CRÉDITO CURTOSIS • VARIABLE: RECENCY (meses) HISTOGRAMA DE FRECUENCIAS CON LA CURVA NORMAL DE LA VARIABLE SIN TRANSFORMAR 170 HISTOGRAMA DE FRECUENCIAS CON LA CURVA NORMAL DE LA VARIABLE TRANSFORMADA VARIABLE: ANTIQUITY (años) 171 VARIABLE: MONETIZE ($/año) 172 ANEXO G. Análisis Factorial. i. BASE AGRUPADA POR CLIENTE A continuación se describe el proceso que se siguió a cabo para llevar a cabo el análisis factorial de las variables incluidas en la base de datos agrupada por cliente. • Objetivos del Análisis Factorial Para el presente estudio, el objetivo general del análisis factorial es determinar qué variables pueden ser agrupadas y cuáles se pueden reducir para disminuir el número total de variables iniciales (30 variables). • Diseño del Análisis Factorial La comprensión de la estructura de las variables requiere un análisis factorial de tipo R, es decir, el cálculo de las correlaciones entre las variables y no entre los clientes, por lo que hace necesaria la matriz inicial de correlaciones. Todas las variables que se incluirán en el análisis factorial son métricas y forman un conjunto homogéneo apropiado para el análisis factorial. El tamaño de la muestra analizada es de 193.510 clientes, la cual cumple con la condición de ser cinco (5) veces mayor que el número total de variables incluidas (30) (Hair, 1999). • Supuestos del Análisis Factorial Los supuestos estadísticos subyacentes al análisis factorial (normalidad, linealidad y homocedasticidad) fueron analizados en el Anexo E del presente trabajo de grado. Los resultados generados por el software PASW 18.0 indican el siguiente comportamiento en la matriz original de datos. - Hay cierto grado de multicolinealidad. - Suficientes correlaciones para justificar el análisis factorial. Se puede concluir que la mayoría de las correlaciones iniciales son mayores a 0,30 lo que indica que el análisis factorial es apropiado. - Las correlaciones parciales o anti-imagen menores indican que la matriz de datos es adecuada para el análisis factorial. La evaluación de la aplicación de factorial se presenta a continuación en el KMO y Prueba de Barllet. La matriz de correlación, la inversa de la matriz de correlación y las matrices anti-imagen no se presentan en el presente anexo por el tamaño que representan, dado el número total de las variables. 173 Los estadísticos correspondientes al estudio de la adecuación de la muestra al modelo, están representados a través del KMO y la Prueba de Barllet. La adecuación muestral a este análisis no resulta deseable, ya que la Medida de Adecuación Muestral de Kaiser – Meyer – Olkin indica que la proporción de la varianza que tienen en común las variables, 0,362, está un poco por debajo de 0,5 y no es muy cercana a ésta. Mediante la prueba de esfericidad de Barlett se puede concluir que la significación de 0,000 indica que se puede rechazar la hipótesis nula de esfericidad, ya que está por debajo del nivel crítico 0,05. Esto implica que las variables se ajustan correctamente al análisis factorial (Bernal García, Martínez María- Dolores, & Sánchez García, 2003). KMO y Prueba de Barllet. Fuente: PASW 18.0. • Derivación de los factores y valoración del ajuste global Una vez se tienen todas las correlaciones se procede a hallar las comunalidades de cada una de las variables, la varianza total explicada y el gráfico de sedimentación. El método que se empleó para la extracción de factores fue el de componentes principales, ya que el propósito general del análisis factorial fue el de resumir la mayoría de la información original (varianza) en una mínima cantidad de factores con propósitos de predicción (Hair, 1999). Es importante aclarar que el uso de componentes principales sugiere las siguientes condiciones: - Basado en la varianza total. Estima los factores que contienen proporciones bajas de la varianza única y en algunos casos la varianza de error. Se insertan las unidades en la diagonal de la matriz de correlación para que se traiga la varianza completa en la matriz de factores. - Se usa con el fin de predecir o disminuir el número de factores. A continuación se presentan los resultados obtenidos con la ayuda del software PASW 18.0. Comunalidades 174 175 Varianza total explicada Fuente: PASW 18.0. 176 Gráfico de sedimentación Fuente: PASW 18.0. De lo anterior se puede concluir que el modelo sugiere que se tengan en cuenta 14 factores. Sin embargo, el gráfico de sedimentación indica que la diferencia entre los primeros 14 factores y los restantes no es concluyente, por lo que se decidió no tener en cuenta los factores sugeridos por el análisis factorial. • Interpretación de los factores A continuación se presenta la matriz que describe las variables en cada uno de los componentes sugeridos. 177 Fuente: PASW 18.0. Los 14 factores sugeridos describen el 64,811% de la población inicial. • Rotación de los factores Finalmente se rotó la matriz de factores obtenida para distribuir la varianza de los primeros factores a los últimos, con el fin de lograr un patrón de factores más simple y teóricamente más significativo. Se utilizó el software PASW 18.0 y se rotaron los factores de acuerdo con el criterio Varimax. A continuación se ilustran gráficamente los resultados obtenidos. Fuente: PASW 18.0. En general, después de realizar el análisis factorial se puede concluir que aunque no se van a tener en cuenta los 14 factores sugeridos, se van a eliminar las siguientes variables del estudio: Monto Total Declinado, Monto Mínimo, Monto Máximo, % Visa Internacional y % Master Internacional. 178 ii. BASE CON INFORMACIÓN DEL PRODUCTO DE TARJETA DE CRÉDITO A continuación se describe el proceso que se siguió a cabo para llevar a cabo el análisis factorial de las variables incluidas en la base de datos con información del producto de tarjeta de crédito. • Objetivos del Análisis Factorial Para el presente estudio, el objetivo general del análisis factorial es determinar qué variables pueden ser agrupadas y cuáles se pueden reducir para disminuir el número total de variables iniciales (3 variables). • Diseño del Análisis Factorial La comprensión de la estructura de las variables requiere un análisis factorial de tipo R, es decir, el cálculo de las correlaciones entre las variables y no entre los clientes, por lo que hace necesaria la matriz inicial de correlaciones. Todas las variables que se incluirán en el análisis factorial son métricas y forman un conjunto homogéneo apropiado para el análisis factorial. El tamaño de la muestra analizada es de 185.268 clientes, la cual cumple con la condición de ser cinco (5) veces mayor que el número total de variables incluidas (30) (Hair, 1999). • Supuestos del Análisis Factorial Los supuestos estadísticos subyacentes al análisis factorial (normalidad, linealidad y homocedasticidad) fueron analizados en el Anexo E del presente trabajo de grado. Los resultados generados por el software PASW 18.0 indican el siguiente comportamiento en la matriz original de datos. - Hay cierto grado de multicolinealidad. - Suficientes correlaciones para justificar el análisis factorial. Se puede concluir que la mayoría de las correlaciones iniciales son mayores a 0,30 lo que indica que el análisis factorial es apropiado. - Las correlaciones parciales o anti-imagen menores indican que la matriz de datos es adecuada para el análisis factorial. La evaluación de la aplicación de factorial se presenta a continuación en el KMO y Prueba de Barllet, junto con la matriz de correlación, la inversa de la matriz de correlación y las matrices anti-imagen. Matriz de correlaciones. 179 Fuente: PASW 18.0. Inversa de la matriz de correlaciones. Fuente: PASW 18.0. KMO y prueba de Barlett. Fuente: PASW 18.0. Matriz anti-imagen Fuente: PASW 18.0. 180 Los estadísticos correspondientes al estudio de la adecuación de la muestra al modelo, están representados a través del KMO y la Prueba de Barllet. La adecuación muestral a este análisis resulta deseable, ya que la Medida de Adecuación Muestral de Kaiser – Meyer – Olkin indica que la proporción de la varianza que tienen en común las variables, 0,490, que aunque está un poco por debajo de 0,5 y es muy cercana a ésta. Mediante la prueba de esfericidad de Barlett se puede concluir que la significación de 0,000 indica que se puede rechazar la hipótesis nula de esfericidad, ya que está por debajo del nivel crítico 0,05. Esto implica que las variables se ajustan correctamente al análisis factorial (Bernal García, Martínez María- Dolores, & Sánchez García, 2003). • Derivación de los factores y valoración del ajuste global Una vez se tienen todas las correlaciones se procede a hallar las comunalidades de cada una de las variables, la varianza total explicada y el gráfico de sedimentación. El método que se empleó para la extracción de factores fue el de componentes principales, ya que el propósito general del análisis factorial fue el de resumir la mayoría de la información original (varianza) en una mínima cantidad de factores con propósitos de predicción (Hair, 1999). Es importante aclarar que el uso de componentes principales sugiere las siguientes condiciones: - Basado en la varianza total. Estima los factores que contienen proporciones bajas de la varianza única y en algunos casos la varianza de error. Se insertan las unidades en la diagonal de la matriz de correlación para que se traiga la varianza completa en la matriz de factores. - Se usa con el fin de predecir o disminuir el número de factores. A continuación se presentan los resultados obtenidos con la ayuda del software PASW 18.0. Comunalidades Fuente: PASW 18.0. Varianza total explicada 181 Fuente: PASW 18.0. Gráfico de sedimentación Fuente: PASW 18.0. De lo anterior se puede concluir que el modelo sugiere que se tengan en cuenta 2 factores • Interpretación de los factores A continuación se presenta la matriz que describe las variables en cada uno de los componentes sugeridos. Fuente: PASW 18.0. 182 Los 14 factores sugeridos describen el 76,486% de la población inicial. • Rotación de los factores Finalmente se rotó la matriz de factores obtenida para distribuir la varianza de los primeros factores a los últimos, con el fin de lograr un patrón de factores más simple y teóricamente más significativo. Se utilizó el software PASW 18.0 y se rotaron los factores de acuerdo con el criterio Varimax. A continuación se ilustran gráficamente los resultados obtenidos. Fuente: PASW 18.0. En general, después de realizar el análisis factorial se puede concluir que aunque no se van a tener en cuenta los 2 factores sugeridos, se va a trabajar con todas las variables incluidas en la base con información de tarjeta de crédito. 183 ANEXO H. Análisis de varianza con un sólo factor (análisis de 1- ) El análisis de varianza se realiza para comparar el número de grupos (entre cinco y quince) y la distancia de cada caso al centro del clúster. Lo anterior con el fin de determinar cuál es el número óptimo de grupos a tener en cuenta para realizar el conglomerado de K medias. Lo que se busca es determinar el número de grupos que tenga, en promedio, la distancia más baja al centro del clúster. Este análisis estadístico fue realizado con la ayuda del software PASW Statistics 18.0. El proceso que se llevo a cabo consistió en tres pasos: (i) Correr las soluciones de los conglomerados de K medias entre cinco y quince grupos, (ii) guardar en dos variables (para cada uno de los números de grupos) la distancia al centro del clúster y el conglomerado de pertenencia, (iii) correr el ANOVA con la ayuda del software PASW Statistics 18.0, tomando como variable nominal independiente el número de grupos y la variable escalar dependiente la distancia al centro del clúster. i. ANOVA PARA CINCO GRUPOS Fuente: PASW 18.0 En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son homogéneas. Si ello es así, se puede proceder con el análisis de varianza. Fuente: PASW 18.0 La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente (grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo un bajo riesgo de cometer una equivocación. 184 La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 5 niveles del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 4 y 5 son significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000, menor que 0,05). Distancia del caso desde su centro inicial de clasificación Scheffé (I) Número inicial de casos 1 2 3 4 5 (J) Número inicial de casos 2 3 4 5 1 3 4 5 1 2 4 5 1 2 3 5 1 2 3 4 Diferencia de medias (I-J) Error típico Sig. -,24967485 -,28305130 ,07020341 ,03271798 ,24967485 -,03337645 ,31987826 ,28239283 ,28305130 ,03337645 ,35325471 ,31576928 -,07020341 -,31987826 -,35325471 -,03748543 -,03271798 -,28239283 -,31576928 ,03748543 ,00281614 ,00304865 ,00277810 ,00303114 ,00281614 ,00332328 ,00307697 ,00330723 ,00304865 ,00332328 ,00329110 ,00350733 ,00277810 ,00307697 ,00329110 ,00327490 ,00303114 ,00330723 ,00350733 ,00327490 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 Intervalo de confianza al 95% Límite Límite inferior superior -,2583493 -,2410004 -,2924419 -,2736607 ,0616462 ,0787606 ,0233813 ,0420547 ,2410004 ,2583493 -,0436130 -,0231399 ,3104004 ,3293561 ,2722058 ,2925799 ,2736607 ,2924419 ,0231399 ,0436130 ,3431173 ,3633921 ,3049659 ,3265727 -,0787606 -,0616462 -,3293561 -,3104004 -,3633921 -,3431173 -,0475729 -,0273979 -,0420547 -,0233813 -,2925799 -,2722058 -,3265727 -,3049659 ,0273979 ,0475729 Fuente: PASW 18.0 Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable dependiente. Aquí se observa claramente que en todos los grupos las medias difieren entre sí. 185 Fuente: PASW 18.0 ii. ANOVA PARA SEIS GRUPOS Fuente: PASW 18.0 En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son homogéneas. Si ello es así, se puede proceder con el análisis de varianza. Fuente: PASW 18.0 La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente (grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de 186 las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo un bajo riesgo de cometer una equivocación. La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 6 niveles del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 4, 5 y 6 son significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000, menor que 0,05). Distancia del caso desde su centro inicial de clasificación Scheffé (I) Número inicial de casos 1 2 3 4 5 (J) Número inicial de casos 2 3 4 5 6 1 3 4 5 6 1 2 4 5 6 1 2 3 5 6 1 2 Diferencia de medias (I-J) Error típico Sig. ,09480648 -,25877727 -,03097640 -,15375067 ,31313800 -,09480648 -,35358375 -,12578288 -,24855715 ,21833152 ,25877727 ,35358375 ,22780087 ,10502660 ,57191527 ,03097640 ,12578288 -,22780087 -,12277427 ,34411440 ,15375067 ,24855715 ,00278896 ,00475708 ,00276466 ,00297280 ,00279649 ,00278896 ,00482449 ,00287911 ,00307953 ,00290969 ,00475708 ,00482449 ,00481049 ,00493305 ,00482885 ,00276466 ,00287911 ,00481049 ,00305754 ,00288640 ,00297280 ,00307953 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 187 Intervalo de confianza al 95% Límite Límite inferior superior ,0855269 ,1040861 -,2746054 -,2429492 -,0401752 -,0217776 -,1636420 -,1438594 ,3038333 ,3224427 -,1040861 -,0855269 -,3696361 -,3375314 -,1353625 -,1162033 -,2588036 -,2383107 ,2086502 ,2280128 ,2429492 ,2746054 ,3375314 ,3696361 ,2117951 ,2438067 ,0886130 ,1214402 ,5558484 ,5879822 ,0217776 ,0401752 ,1162033 ,1353625 -,2438067 -,2117951 -,1329475 -,1126010 ,3345106 ,3537182 ,1438594 ,1636420 ,2383107 ,2588036 6 3 4 6 1 2 3 4 5 -,10502660 ,12277427 ,46688867 -,31313800 -,21833152 -,57191527 -,34411440 -,46688867 ,00493305 ,00305754 ,00308634 ,00279649 ,00290969 ,00482885 ,00288640 ,00308634 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 -,1214402 ,1126010 ,4566196 -,3224427 -,2280128 -,5879822 -,3537182 -,4771578 -,0886130 ,1329475 ,4771578 -,3038333 -,2086502 -,5558484 -,3345106 -,4566196 Fuente: PASW 18.0 Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable dependiente. Aquí se observa claramente que en todos los grupos las medias difieren entre sí. Fuente: PASW 18.0 iii. ANOVA PARA SIETE GRUPOS Fuente: PASW 18.0 188 En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son homogéneas. Si ello es así, se puede proceder con el análisis de varianza. Fuente: PASW 18.0 La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente (grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo un bajo riesgo de cometer una equivocación. La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 7 niveles del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 4, 5, 6 y 7 son significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000, menor que 0,05). Distancia del caso desde su centro inicial de clasificación Scheffé (I) Número inicial de casos 1 (J) Número inicial de casos 2 3 4 5 Intervalo de confianza al 95% Diferencia de medias (I-J) Error típico Sig. -,36131324 -,31769316 -,42250743 -,06573357 ,00390046 ,00312993 ,03372667 ,00345666 ,000 ,000 ,000 ,000 189 Límite inferior Límite superior -,3751540 -,3287997 -,5421866 -,0779995 -,3474725 -,3065866 -,3028283 -,0534676 2 3 4 5 6 7 6 7 1 3 4 5 6 7 1 2 4 5 6 7 1 2 3 5 6 7 1 2 3 4 6 7 1 2 3 4 5 7 1 2 3 4 5 6 -,12836331 -,14823419 ,36131324 ,04362008 -,06119419 ,29557967 ,23294993 ,21307905 ,31769316 -,04362008 -,10481426 ,25195959 ,18932985 ,16945897 ,42250743 ,06119419 ,10481426 ,35677385 ,29414411 ,27427324 ,06573357 -,29557967 -,25195959 -,35677385 -,06262974 -,08250062 ,12836331 -,23294993 -,18932985 -,29414411 ,06262974 -,01987087 ,14823419 -,21307905 -,16945897 -,27427324 ,08250062 ,01987087 Fuente: PASW 18.0 190 ,00380393 ,00292188 ,00390046 ,00380693 ,03379622 ,00407980 ,00437792 ,00363780 ,00312993 ,00380693 ,03371598 ,00335078 ,00370797 ,00279581 ,03372667 ,03379622 ,03371598 ,03374788 ,03378521 ,03369730 ,00345666 ,00407980 ,00335078 ,03374788 ,00398762 ,00315731 ,00380393 ,00437792 ,00370797 ,03378521 ,00398762 ,00353411 ,00292188 ,00363780 ,00279581 ,03369730 ,00315731 ,00353411 ,000 ,000 ,000 ,000 ,773 ,000 ,000 ,000 ,000 ,000 ,140 ,000 ,000 ,000 ,000 ,773 ,140 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 -,1418616 -,1586025 ,3474725 ,0301112 -,1811201 ,2811025 ,2174149 ,2001703 ,3065866 -,0571290 -,2244555 ,2400694 ,1761721 ,1595380 ,3028283 -,0587318 -,0148270 ,2370194 ,1742572 ,1546983 ,0534676 -,3100569 -,2638498 -,4765283 -,0767798 -,0937043 ,1148651 -,2484850 -,2024876 -,4140310 ,0484797 -,0324117 ,1378659 -,2259878 -,1793799 -,3938482 ,0712969 ,0073301 -,1148651 -,1378659 ,3751540 ,0571290 ,0587318 ,3100569 ,2484850 ,2259878 ,3287997 -,0301112 ,0148270 ,2638498 ,2024876 ,1793799 ,5421866 ,1811201 ,2244555 ,4765283 ,4140310 ,3938482 ,0779995 -,2811025 -,2400694 -,2370194 -,0484797 -,0712969 ,1418616 -,2174149 -,1761721 -,1742572 ,0767798 -,0073301 ,1586025 -,2001703 -,1595380 -,1546983 ,0937043 ,0324117 Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable dependiente. En este caso, se observa que los grupos 3 y 2 no son significativamente diferentes (“valor p” mínimo= 0.459). Aquí se observa claramente que los únicos grupos cuyas medias difieren entre sí son: 1, 5, 7, 3 y 4. Fuente: PASW 18.0 iv. ANOVA PARA OCHO GRUPOS Fuente: PASW 18.0 En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son homogéneas. Si ello es así, se puede proceder con el análisis de varianza. 191 Fuente: PASW 18.0 La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente (grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo un bajo riesgo de cometer una equivocación. La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 8 niveles del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 4, 5, 6, 7 y 8 son significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000 y para el 6 = 0,494, menor que 0,05). Distancia del caso desde su centro inicial de clasificación Scheffé (I) Número inicial de casos 1 2 (J) Número inicial de casos 2 3 4 5 6 7 8 1 3 4 Diferencia de medias (I-J) Error típico Sig. -,07210605 ,30756200 ,09017580 ,11089586 ,02709080 ,34013025 ,11402224 ,07210605 ,37966805 ,16228186 ,01081169 ,01123468 ,01442157 ,01088419 ,01071274 ,01096915 ,01336164 ,01081169 ,00475356 ,01021567 ,000 ,000 ,000 ,000 ,494 ,000 ,000 ,000 ,000 ,000 192 Intervalo de confianza al 95% Límite Límite inferior superior -,1126570 -,0315551 ,2654245 ,3496995 ,0360854 ,1442662 ,0700729 ,1517188 -,0130891 ,0672707 ,2989887 ,3812718 ,0639072 ,1641372 ,0315551 ,1126570 ,3618390 ,3974971 ,1239663 ,2005974 3 4 5 6 7 8 5 6 7 8 1 2 4 5 6 7 8 1 2 3 5 6 7 8 1 2 3 4 6 7 8 1 2 3 4 5 7 8 1 2 3 4 5 6 8 1 ,18300191 ,09919685 ,41223631 ,18612830 -,30756200 -,37966805 -,21738620 -,19666614 -,28047120 ,03256825 -,19353975 -,09017580 -,16228186 ,21738620 ,02072006 -,06308500 ,24995445 ,02384644 -,11089586 -,18300191 ,19666614 -,02072006 -,08380506 ,22923439 ,00312639 -,02709080 -,09919685 ,28047120 ,06308500 ,08380506 ,31303945 ,08693144 -,34013025 -,41223631 -,03256825 -,24995445 -,22923439 -,31303945 -,22610801 -,11402224 193 ,00385276 ,00333782 ,00408663 ,00865515 ,01123468 ,00475356 ,01066233 ,00491622 ,00452400 ,00510157 ,00917808 ,01442157 ,01021567 ,01066233 ,01029237 ,01011089 ,01038218 ,01288412 ,01088419 ,00385276 ,00491622 ,01029237 ,00356567 ,00427475 ,00874554 ,01071274 ,00333782 ,00452400 ,01011089 ,00356567 ,00381717 ,00853123 ,01096915 ,00408663 ,00510157 ,01038218 ,00427475 ,00381717 ,00885106 ,01336164 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,774 ,000 ,000 ,843 ,000 ,000 ,000 ,774 ,000 ,000 1,000 ,494 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,1685515 ,0866778 ,3969087 ,1536658 -,3496995 -,3974971 -,2573770 -,2151052 -,2974392 ,0134340 -,2279636 -,1442662 -,2005974 ,1773954 -,0178831 -,1010075 ,2110144 -,0244776 -,1517188 -,1974523 ,1782270 -,0593232 -,0971787 ,2132013 -,0296752 -,0672707 -,1117159 ,2635032 ,0251625 ,0704314 ,2987225 ,0549337 -,3812718 -,4275639 -,0517025 -,2888945 -,2452675 -,3273564 -,2593054 -,1641372 ,1974523 ,1117159 ,4275639 ,2185908 -,2654245 -,3618390 -,1773954 -,1782270 -,2635032 ,0517025 -,1591159 -,0360854 -,1239663 ,2573770 ,0593232 -,0251625 ,2888945 ,0721704 -,0700729 -,1685515 ,2151052 ,0178831 -,0704314 ,2452675 ,0359280 ,0130891 -,0866778 ,2974392 ,1010075 ,0971787 ,3273564 ,1189292 -,2989887 -,3969087 -,0134340 -,2110144 -,2132013 -,2987225 -,1929107 -,0639072 2 3 4 5 6 7 -,18612830 ,19353975 -,02384644 -,00312639 -,08693144 ,22610801 ,00865515 ,00917808 ,01288412 ,00874554 ,00853123 ,00885106 ,000 ,000 ,843 1,000 ,000 ,000 -,2185908 ,1591159 -,0721704 -,0359280 -,1189292 ,1929107 -,1536658 ,2279636 ,0244776 ,0296752 -,0549337 ,2593054 Fuente: PASW 18.0 Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable dependiente. En este caso, se observa que los grupos 7 y 3 no son significativamente diferentes (“valor p” mínimo= 0.68). Aquí se observa claramente que en todos los grupos las medias difieren entre sí. Fuente: PASW 18.0 v. ANOVA PARA NUEVE GRUPOS Fuente: PASW 18.0 194 En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son homogéneas. Si ello es así, se puede proceder con el análisis de varianza. Fuente: PASW 18.0 La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente (grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo un bajo riesgo de cometer una equivocación. La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 9 niveles del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 4, 5, 6, 8 y 9 son significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000, menor que 0,05) y en cambio el grupo 7 no es significativamente diferente entre sí (“valor p”=1,000 mucho mayor que 0,05). Distancia del caso desde su centro inicial de clasificación Scheffé (I) Número inicial de casos 1 (J) Número inicial de casos 2 3 4 5 6 Diferencia de medias (I-J) Error típico Sig. ,17655980 -,21556447 -,08136093 -,09950884 ,14066699 ,00441167 ,00448566 ,00421864 ,00483387 ,00458274 ,000 ,000 ,000 ,000 ,000 195 Intervalo de confianza al 95% Límite inferior Límite superior ,1591867 -,2332289 -,0979738 -,1185445 ,1226202 ,1939329 -,1979000 -,0647480 -,0804731 ,1587137 2 3 4 5 6 7 8 9 1 3 4 5 6 7 8 9 1 2 4 5 6 7 8 9 1 2 3 5 6 7 8 9 1 2 3 4 6 7 8 9 1 2 3 4 5 ,00216948 ,20595391 -,39396122 -,17655980 -,39212428 -,25792073 -,27606864 -,03589281 -,17439032 ,02939410 -,57052102 ,21556447 ,39212428 ,13420354 ,11605564 ,35623147 ,21773396 ,42151838 -,17839674 ,08136093 ,25792073 -,13420354 -,01814791 ,22202792 ,08353041 ,28731484 -,31260029 ,09950884 ,27606864 -,11605564 ,01814791 ,24017583 ,10167832 ,30546274 -,29445238 -,14066699 ,03589281 -,35623147 -,22202792 -,24017583 196 ,00484788 ,00425117 ,00573697 ,00441167 ,00355165 ,00320780 ,00398238 ,00367349 ,00399938 ,00325047 ,00504043 ,00448566 ,00355165 ,00330882 ,00406420 ,00376203 ,00408085 ,00335020 ,00510532 ,00421864 ,00320780 ,00330882 ,00376742 ,00343928 ,00378538 ,00298322 ,00487237 ,00483387 ,00398238 ,00406420 ,00376742 ,00417110 ,00446077 ,00380382 ,00541381 ,00458274 ,00367349 ,00376203 ,00343928 ,00417110 1,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,003 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,003 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 -,0169214 ,1892129 -,4165533 -,1939329 -,4061106 -,2705530 -,2917512 -,0503590 -,1901398 ,0165938 -,5903701 ,1979000 ,3781379 ,1211735 ,1000509 ,3414166 ,2016636 ,4083253 -,1985014 ,0647480 ,2452885 -,1472336 -,0329839 ,2084841 ,0686237 ,2755670 -,3317876 ,0804731 ,2603861 -,1320604 ,0033119 ,2237501 ,0841119 ,2904834 -,3157719 -,1587137 ,0214267 -,3710463 -,2355717 -,2566015 ,0212604 ,2226949 -,3713691 -,1591867 -,3781379 -,2452885 -,2603861 -,0214267 -,1586409 ,0421944 -,5506719 ,2332289 ,4061106 ,1472336 ,1320604 ,3710463 ,2338043 ,4347114 -,1582921 ,0979738 ,2705530 -,1211735 -,0033119 ,2355717 ,0984372 ,2990627 -,2934130 ,1185445 ,2917512 -,1000509 ,0329839 ,2566015 ,1192448 ,3204421 -,2731329 -,1226202 ,0503590 -,3414166 -,2084841 -,2237501 7 8 9 7 8 9 1 2 3 4 5 6 8 9 1 2 3 4 5 6 7 9 1 2 3 4 5 6 7 8 -,13849751 ,06528691 -,53462821 -,00216948 ,17439032 -,21773396 -,08353041 -,10167832 ,13849751 ,20378442 -,39613070 -,20595391 -,02939410 -,42151838 -,28731484 -,30546274 -,06528691 -,20378442 -,59991512 ,39396122 ,57052102 ,17839674 ,31260029 ,29445238 ,53462821 ,39613070 ,59991512 ,00418732 ,00347911 ,00519082 ,00484788 ,00399938 ,00408085 ,00378538 ,00446077 ,00418732 ,00382160 ,00542633 ,00425117 ,00325047 ,00335020 ,00298322 ,00380382 ,00347911 ,00382160 ,00490057 ,00573697 ,00504043 ,00510532 ,00487237 ,00541381 ,00519082 ,00542633 ,00490057 ,000 ,000 ,000 1,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 -,1549871 ,0515862 -,5550695 -,0212604 ,1586409 -,2338043 -,0984372 -,1192448 ,1220079 ,1887350 -,4174995 -,2226949 -,0421944 -,4347114 -,2990627 -,3204421 -,0789876 -,2188338 -,6192135 ,3713691 ,5506719 ,1582921 ,2934130 ,2731329 ,5141869 ,3747619 ,5806168 -,1220079 ,0789876 -,5141869 ,0169214 ,1901398 -,2016636 -,0686237 -,0841119 ,1549871 ,2188338 -,3747619 -,1892129 -,0165938 -,4083253 -,2755670 -,2904834 -,0515862 -,1887350 -,5806168 ,4165533 ,5903701 ,1985014 ,3317876 ,3157719 ,5550695 ,4174995 ,6192135 Fuente: PASW 18.0 Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable dependiente. Aquí se observa claramente que en todos los grupos las medias difieren entre sí. 197 Fuente: PASW 18.0 vi. ANOVA PARA DIEZ GRUPOS Fuente: PASW 18.0 En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son homogéneas. Si ello es así, se puede proceder con el análisis de varianza. Fuente: PASW 18.0 198 La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente (grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo un bajo riesgo de cometer una equivocación. La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 10 niveles del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 5, 6, 7, 8 y 9 son significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000, menor que 0,05) y en cambio el grupo 4 no es significativamente diferente entre sí (“valor p”=0.999, mucho mayor que 0,05). Distancia del caso desde su centro inicial de clasificación Scheffé (I) Número inicial de casos 1 2 (J) Número inicial de casos 2 3 4 5 6 7 8 9 10 1 3 4 5 6 7 8 9 10 Intervalo de confianza al 95% Diferencia de medias (I-J) Error típico Sig. -,35586433 -,26638702 ,00583677 -,05192432 -,28109225 -,03695077 -,06997152 -,37948642 -,09765198 ,35586433 ,08947732 ,36170110 ,30394002 ,07477209 ,31891357 ,28589281 -,02362208 ,25821236 ,01157446 ,00936223 ,00567387 ,00527876 ,01088198 ,00495723 ,00568725 ,00483893 ,00607105 ,01157446 ,01369041 ,01148777 ,01129784 ,01477137 ,01115124 ,01149438 ,01109915 ,01168904 ,000 ,000 ,999 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,002 ,000 ,000 ,873 ,000 199 Límite inferior Límite superior -,4034738 -,3048969 -,0175017 -,0736375 -,3258533 -,0573415 -,0933650 -,3993905 -,1226242 ,3082549 ,0331643 ,3144482 ,2574684 ,0140127 ,2730449 ,2386127 -,0692765 ,2101316 -,3082549 -,2278772 ,0291752 -,0302111 -,2363312 -,0165601 -,0465781 -,3595824 -,0726798 ,4034738 ,1457904 ,4089540 ,3504117 ,1355315 ,3647822 ,3331729 ,0220323 ,3062931 3 4 5 6 7 1 2 4 5 6 7 8 9 10 1 2 3 5 6 7 8 9 10 1 2 3 4 6 7 8 9 10 1 2 3 4 5 7 8 9 10 1 2 3 4 ,26638702 -,08947732 ,27222379 ,21446270 -,01470523 ,22943625 ,19641549 -,11309940 ,16873504 -,00583677 -,36170110 -,27222379 -,05776109 -,28692902 -,04278754 -,07580829 -,38532319 -,10348875 ,05192432 -,30394002 -,21446270 ,05776109 -,22916793 ,01497355 -,01804720 -,32756210 -,04572766 ,28109225 -,07477209 ,01470523 ,28692902 ,22916793 ,24414148 ,21112072 -,09839417 ,18344027 ,03695077 -,31891357 -,22943625 ,04278754 200 ,00936223 ,01369041 ,00925484 ,00901801 ,01311017 ,00883365 ,00926304 ,00876780 ,00950352 ,00567387 ,01148777 ,00925484 ,00508585 ,01078972 ,00475129 ,00550867 ,00462772 ,00590409 ,00527876 ,01129784 ,00901801 ,00508585 ,01058728 ,00427168 ,00510077 ,00413379 ,00552546 ,01088198 ,01477137 ,01311017 ,01078972 ,01058728 ,01043070 ,01079676 ,01037499 ,01100377 ,00495723 ,01115124 ,00883365 ,00475129 ,000 ,000 ,000 ,000 ,999 ,000 ,000 ,000 ,000 ,999 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,198 ,186 ,000 ,000 ,000 ,002 ,999 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,2278772 -,1457904 ,2341557 ,1773687 -,0686316 ,1931006 ,1583136 -,1491642 ,1296440 -,0291752 -,4089540 -,3102919 -,0786808 -,3313106 -,0623311 -,0984672 -,4043585 -,1277742 ,0302111 -,3504117 -,2515567 ,0368414 -,2727168 -,0025972 -,0390283 -,3445657 -,0684556 ,2363312 -,1355315 -,0392211 ,2425474 ,1856190 ,2012367 ,1667102 -,1410698 ,1381782 ,0165601 -,3647822 -,2657719 ,0232439 ,3048969 -,0331643 ,3102919 ,2515567 ,0392211 ,2657719 ,2345174 -,0770346 ,2078261 ,0175017 -,3144482 -,2341557 -,0368414 -,2425474 -,0232439 -,0531494 -,3662879 -,0792033 ,0736375 -,2574684 -,1773687 ,0786808 -,1856190 ,0325443 ,0029339 -,3105585 -,0229997 ,3258533 -,0140127 ,0686316 ,3313106 ,2727168 ,2870463 ,2555313 -,0557185 ,2287023 ,0573415 -,2730449 -,1931006 ,0623311 8 9 10 5 6 8 9 10 1 2 3 4 5 6 7 9 10 1 2 3 4 5 6 7 8 10 1 2 3 4 5 6 7 8 9 -,01497355 -,24414148 -,03302076 -,34253565 -,06070121 ,06997152 -,28589281 -,19641549 ,07580829 ,01804720 -,21112072 ,03302076 -,30951489 -,02768045 ,37948642 ,02362208 ,11309940 ,38532319 ,32756210 ,09839417 ,34253565 ,30951489 ,28183444 ,09765198 -,25821236 -,16873504 ,10348875 ,04572766 -,18344027 ,06070121 ,02768045 -,28183444 ,00427168 ,01043070 ,00476726 ,00371446 ,00521916 ,00568725 ,01149438 ,00926304 ,00550867 ,00510077 ,01079676 ,00476726 ,00464411 ,00591694 ,00483893 ,01109915 ,00876780 ,00462772 ,00413379 ,01037499 ,00371446 ,00464411 ,00510692 ,00607105 ,01168904 ,00950352 ,00590409 ,00552546 ,01100377 ,00521916 ,00591694 ,00510692 ,198 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,186 ,000 ,000 ,000 ,009 ,000 ,873 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,009 ,000 -,0325443 -,2870463 -,0526300 -,3578144 -,0821693 ,0465781 -,3331729 -,2345174 ,0531494 -,0029339 -,2555313 ,0134115 -,3286176 -,0520187 ,3595824 -,0220323 ,0770346 ,3662879 ,3105585 ,0557185 ,3272569 ,2904122 ,2608280 ,0726798 -,3062931 -,2078261 ,0792033 ,0229997 -,2287023 ,0392331 ,0033422 -,3028409 ,0025972 -,2012367 -,0134115 -,3272569 -,0392331 ,0933650 -,2386127 -,1583136 ,0984672 ,0390283 -,1667102 ,0526300 -,2904122 -,0033422 ,3993905 ,0692765 ,1491642 ,4043585 ,3445657 ,1410698 ,3578144 ,3286176 ,3028409 ,1226242 -,2101316 -,1296440 ,1277742 ,0684556 -,1381782 ,0821693 ,0520187 -,2608280 Fuente: PASW 18.0. Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable dependiente. Se observa que los grupos 7, 5 y 8 no son significativamente diferentes (“valor p” mínimo α = 201 0.111). Aquí se observa más claramente que los únicos grupos de ventas cuyas medias difieren entre sí son; 4, 1, 7, 5, 10, 3, 6, 2 y 9. Fuente: PASW 18.0. vii. ANOVA PARA ONCE GRUPOS Fuente: PASW 18.0. En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son homogéneas. Si ello es así, se puede proceder con el análisis de varianza. 202 Fuente: PASW 18.0. La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente (grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo un bajo riesgo de cometer una equivocación. La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 11 niveles del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 5, 6, 7, 8 y 9 son significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000, menor que 0,05) y en cambio el grupo 4 no es significativamente diferente entre sí (“valor p”=0.999, mucho mayor que 0,05). Distancia del caso desde su centro inicial de clasificación Scheffé (I) Número inicial de casos 1 (J) Número inicial de casos 2 3 4 5 6 7 8 9 10 Diferencia de medias (I-J) Error típico Sig. -,19947467 ,15671107 ,00440566 ,26872896 -,33513071 -,21662483 -,12612412 -,06713926 -,17449368 ,00637974 ,00425677 ,00416451 ,00395955 ,03011261 ,00632378 ,00431101 ,00365781 ,00390925 ,000 ,000 1,000 ,000 ,000 ,000 ,000 ,000 ,000 203 Intervalo de confianza al 95% Límite inferior Límite superior -,2267718 ,1384975 -,0134131 ,2517871 -,4639744 -,2436826 -,1445698 -,0827900 -,1912203 -,1721775 ,1749246 ,0222245 ,2856708 -,2062870 -,1895671 -,1076785 -,0514885 -,1577671 2 3 4 5 11 1 3 4 5 6 7 8 9 10 11 1 2 4 5 6 7 8 9 10 11 1 2 3 5 6 7 8 9 10 11 1 2 3 4 6 7 8 9 10 ,18192185 ,19947467 ,35618574 ,20388033 ,46820363 -,13565603 -,01715015 ,07335056 ,13233541 ,02498100 ,38139653 -,15671107 -,35618574 -,15230541 ,11201789 -,49184178 -,37333590 -,28283519 -,22385033 -,33120475 ,02521078 -,00440566 -,20388033 ,15230541 ,26432330 -,33953637 -,22103048 -,13052977 -,07154492 -,17889933 ,17751620 -,26872896 -,46820363 -,11201789 -,26432330 -,60385967 -,48535378 -,39485307 -,33586822 -,44322263 204 ,00365707 ,00637974 ,00632439 ,00626266 ,00612828 ,03047371 ,00786563 ,00636103 ,00593779 ,00609591 ,00593734 ,00425677 ,00632439 ,00407922 ,00386974 ,03010093 ,00626794 ,00422867 ,00356040 ,00381826 ,00355964 ,00416451 ,00626266 ,00407922 ,00376801 ,03008803 ,00620565 ,00413578 ,00344956 ,00371512 ,00344878 ,00395955 ,00612828 ,00386974 ,00376801 ,03006034 ,00607001 ,00392933 ,00319912 ,00348383 ,000 ,000 ,000 ,000 ,000 ,031 ,907 ,000 ,000 ,079 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 1,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,1662742 ,1721775 ,3291254 ,1770841 ,4419824 -,2660448 -,0508050 ,0461335 ,1069292 -,0011017 ,3559923 -,1749246 -,3832461 -,1697593 ,0954603 -,6206355 -,4001547 -,3009285 -,2390843 -,3475421 ,0099800 -,0222245 -,2306766 ,1348516 ,2482010 -,4682749 -,2475828 -,1482257 -,0863047 -,1947953 ,1627598 -,2856708 -,4944249 -,1285755 -,2804456 -,7324797 -,5113257 -,4116656 -,3495564 -,4581290 ,1975695 ,2267718 ,3832461 ,2306766 ,4944249 -,0052673 ,0165047 ,1005677 ,1577416 ,0510637 ,4068008 -,1384975 -,3291254 -,1348516 ,1285755 -,3630480 -,3465171 -,2647418 -,2086163 -,3148674 ,0404415 ,0134131 -,1770841 ,1697593 ,2804456 -,2107978 -,1944782 -,1128339 -,0567852 -,1630033 ,1922726 -,2517871 -,4419824 -,0954603 -,2482010 -,4752396 -,4593818 -,3780405 -,3221800 -,4283163 6 7 8 9 11 1 2 3 4 5 7 8 9 10 11 1 2 3 4 5 6 8 9 10 11 1 2 3 4 5 6 7 9 10 11 1 2 3 4 5 6 7 8 10 -,08680710 ,33513071 ,13565603 ,49184178 ,33953637 ,60385967 ,11850588 ,20900659 ,26799145 ,16063703 ,51705256 ,21662483 ,01715015 ,37333590 ,22103048 ,48535378 -,11850588 ,09050071 ,14948557 ,04213115 ,39854668 ,12612412 -,07335056 ,28283519 ,13052977 ,39485307 -,20900659 -,09050071 ,05898486 -,04836956 ,30804597 ,06713926 -,13233541 ,22385033 ,07154492 ,33586822 -,26799145 -,14948557 -,05898486 -,10735442 205 ,00319828 ,03011261 ,03047371 ,03010093 ,03008803 ,03006034 ,03046205 ,03010865 ,03002209 ,03005376 ,03002200 ,00632378 ,00786563 ,00626794 ,00620565 ,00607001 ,03046205 ,00630490 ,00587763 ,00603732 ,00587718 ,00431101 ,00636103 ,00422867 ,00413578 ,00392933 ,03010865 ,00630490 ,00362507 ,00387864 ,00362433 ,00365781 ,00593779 ,00356040 ,00344956 ,00319912 ,03002209 ,00587763 ,00362507 ,00313665 ,000 ,000 ,031 ,000 ,000 ,000 ,127 ,000 ,000 ,001 ,000 ,000 ,907 ,000 ,000 ,000 ,127 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 -,1004917 ,2062870 ,0052673 ,3630480 ,2107978 ,4752396 -,0118330 ,0801798 ,1395351 ,0320451 ,3885966 ,1895671 -,0165047 ,3465171 ,1944782 ,4593818 -,2488447 ,0635237 ,1243368 ,0162991 ,3733998 ,1076785 -,1005677 ,2647418 ,1128339 ,3780405 -,3378334 -,1174777 ,0434742 -,0649652 ,2925384 ,0514885 -,1577416 ,2086163 ,0567852 ,3221800 -,3964478 -,1746344 -,0744956 -,1207753 -,0731225 ,4639744 ,2660448 ,6206355 ,4682749 ,7324797 ,2488447 ,3378334 ,3964478 ,2892289 ,6455086 ,2436826 ,0508050 ,4001547 ,2475828 ,5113257 ,0118330 ,1174777 ,1746344 ,0679632 ,4236935 ,1445698 -,0461335 ,3009285 ,1482257 ,4116656 -,0801798 -,0635237 ,0744956 -,0317739 ,3235535 ,0827900 -,1069292 ,2390843 ,0863047 ,3495564 -,1395351 -,1243368 -,0434742 -,0939335 10 11 11 1 2 3 4 5 6 7 8 9 11 1 2 3 4 5 6 7 8 9 10 ,24906111 ,17449368 -,02498100 ,33120475 ,17889933 ,44322263 -,16063703 -,04213115 ,04836956 ,10735442 ,35641553 -,18192185 -,38139653 -,02521078 -,17751620 ,08680710 -,51705256 -,39854668 -,30804597 -,24906111 -,35641553 Fuente: PASW 18.0. Fuente: PASW 18.0. 206 ,00281612 ,00390925 ,00609591 ,00381826 ,00371512 ,00348383 ,03005376 ,00603732 ,00387864 ,00313665 ,00313579 ,00365707 ,00593734 ,00355964 ,00344878 ,00319828 ,03002200 ,00587718 ,00362433 ,00281612 ,00313579 ,000 ,000 ,079 ,000 ,000 ,000 ,001 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,2370117 ,1577671 -,0510637 ,3148674 ,1630033 ,4283163 -,2892289 -,0679632 ,0317739 ,0939335 ,3429983 -,1975695 -,4068008 -,0404415 -,1922726 ,0731225 -,6455086 -,4236935 -,3235535 -,2611105 -,3698327 ,2611105 ,1912203 ,0011017 ,3475421 ,1947953 ,4581290 -,0320451 -,0162991 ,0649652 ,1207753 ,3698327 -,1662742 -,3559923 -,0099800 -,1627598 ,1004917 -,3885966 -,3733998 -,2925384 -,2370117 -,3429983 Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable dependiente. Se observa que los grupos 8 y 10 no son significativamente diferentes (“valor p” mínimo α= 0.242). Aquí se observa más claramente que los únicos grupos de ventas cuyas medias difieren entre sí son; 1, 2, 3, 4, 5, 6, 7, 8, 9 y 11. viii. ANOVA PARA DOCE GRUPOS Fuente: PASW 18.0. En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son homogéneas. Si ello es así, se puede proceder con el análisis de varianza. Fuente: PASW 18.0. La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente (grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo un bajo riesgo de cometer una equivocación. La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 12 niveles del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de 207 confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 4, 6, 7, 8, 9, 10, 11 y 12 son significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000, menor que 0,05) y en cambio el grupo 5 no es significativamente diferente entre sí (“valor p”=1,000), mucho mayor que 0,05). Distancia del caso desde su centro inicial de clasificación Scheffé (I) Número inicial de casos 1 2 3 (J) Número inicial de casos 2 3 4 5 6 7 8 9 10 11 12 1 3 4 5 6 7 8 9 10 11 12 1 2 4 5 6 7 Diferencia de medias (I-J) Error típico Sig. -,26737856 -,01964307 -,13927215 ,00122266 -,63112670 -,67459586 -,26259151 -,51727147 -,32356216 -,04703926 -,34769440 ,26737856 ,24773550 ,12810641 ,26860122 -,36374814 -,40721730 ,00478705 -,24989291 -,05618360 ,22033930 -,08031583 ,01964307 -,24773550 -,11962909 ,02086573 -,61148363 -,65495279 ,00378353 ,00425551 ,00381175 ,00394134 ,02959023 ,00475150 ,00413068 ,00343346 ,00320710 ,00378385 ,00315112 ,00378353 ,00467496 ,00427496 ,00439089 ,02965345 ,00513055 ,00456162 ,00394137 ,00374583 ,00425009 ,00369802 ,00425551 ,00467496 ,00469782 ,00480356 ,02971736 ,00548788 ,000 ,030 ,000 1,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 1,000 ,000 ,000 ,000 ,000 ,030 ,000 ,000 ,064 ,000 ,000 208 Intervalo de confianza al 95% Límite Límite inferior superior -,2841613 -,2505958 -,0385194 -,0007668 -,1561800 -,1223643 -,0162600 ,0187054 -,7623809 -,4998725 -,6956722 -,6535195 -,2809141 -,2442689 -,5325014 -,5020416 -,3377880 -,3093364 -,0638234 -,0302551 -,3616719 -,3337169 ,2505958 ,2841613 ,2269987 ,2684723 ,1091439 ,1470690 ,2491244 ,2880780 -,4952828 -,2322135 -,4299750 -,3844596 -,0154470 ,0250211 -,2673758 -,2324100 -,0727991 -,0395681 ,2014870 ,2391916 -,0967192 -,0639124 ,0007668 ,0385194 -,2684723 -,2269987 -,1404673 -,0987908 -,0004416 ,0421730 -,7433018 -,4796655 -,6792955 -,6306100 4 5 6 7 8 9 10 11 12 1 2 3 5 6 7 8 9 10 11 12 1 2 3 4 6 7 8 9 10 11 12 1 2 3 4 5 7 8 9 10 11 12 1 2 -,24294844 -,49762841 -,30391909 -,02739620 -,32805133 ,13927215 -,12810641 ,11962909 ,14049481 -,49185455 -,53532371 -,12331936 -,37799932 -,18429001 ,09223289 -,20842224 -,00122266 -,26860122 -,02086573 -,14049481 -,63234936 -,67581852 -,26381417 -,51849413 -,32478482 -,04826192 -,34891705 ,63112670 ,36374814 ,61148363 ,49185455 ,63234936 -,04346916 ,36853519 ,11385523 ,30756454 ,58408744 ,28343231 ,67459586 ,40721730 209 ,00496010 ,00439644 ,00422203 ,00467521 ,00417967 ,00381175 ,00427496 ,00469782 ,00441523 ,02965707 ,00515140 ,00458505 ,00396847 ,00377433 ,00427523 ,00372688 ,00394134 ,00439089 ,00480356 ,00441523 ,02967400 ,00524801 ,00469333 ,00409310 ,00390516 ,00439116 ,00385932 ,02959023 ,02965345 ,02971736 ,02965707 ,02967400 ,02979243 ,02969974 ,02961082 ,02958543 ,02965349 ,02957941 ,00475150 ,00513055 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 1,000 ,000 ,064 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,998 ,000 ,193 ,000 ,000 ,000 ,000 ,000 -,2649501 -,5171298 -,3226469 -,0481342 -,3465912 ,1223643 -,1470690 ,0987908 ,1209101 -,6234052 -,5581739 -,1436574 -,3956024 -,2010319 ,0732691 -,2249537 -,0187054 -,2880780 -,0421730 -,1600796 -,7639751 -,6990973 -,2846325 -,5366500 -,3421070 -,0677399 -,3660359 ,4998725 ,2322135 ,4796655 ,3603039 ,5007236 -,1756203 ,2367952 -,0174903 ,1763316 ,4525526 ,1522261 ,6535195 ,3844596 -,2209468 -,4781270 -,2851913 -,0066582 -,3095115 ,1561800 -,1091439 ,1404673 ,1600796 -,3603039 -,5124735 -,1029813 -,3603963 -,1675481 ,1111967 -,1918908 ,0162600 -,2491244 ,0004416 -,1209101 -,5007236 -,6525398 -,2429958 -,5003383 -,3074626 -,0287839 -,3317982 ,7623809 ,4952828 ,7433018 ,6234052 ,7639751 ,0886820 ,5002752 ,2452008 ,4387975 ,7156223 ,4146385 ,6956722 ,4299750 8 9 10 3 4 5 6 8 9 10 11 12 1 2 3 4 5 6 7 9 10 11 12 1 2 3 4 5 6 7 8 10 11 12 1 2 3 4 5 6 7 8 9 ,65495279 ,53532371 ,67581852 ,04346916 ,41200435 ,15732439 ,35103370 ,62755660 ,32690147 ,26259151 -,00478705 ,24294844 ,12331936 ,26381417 -,36853519 -,41200435 -,25467996 -,06097065 ,21555225 -,08510288 ,51727147 ,24989291 ,49762841 ,37799932 ,51849413 -,11385523 -,15732439 ,25467996 ,19370931 ,47023221 ,16957708 ,32356216 ,05618360 ,30391909 ,18429001 ,32478482 -,30756454 -,35103370 ,06097065 -,19370931 210 ,00548788 ,00515140 ,00524801 ,02979243 ,00539166 ,00487812 ,00472154 ,00513079 ,00468369 ,00413068 ,00456162 ,00496010 ,00458505 ,00469333 ,02969974 ,00539166 ,00427573 ,00409618 ,00456188 ,00405250 ,00343346 ,00394137 ,00439644 ,00396847 ,00409310 ,02961082 ,00487812 ,00427573 ,00339187 ,00394168 ,00333899 ,00320710 ,00374583 ,00422203 ,00377433 ,00390516 ,02958543 ,00472154 ,00409618 ,00339187 ,000 ,000 ,000 ,998 ,000 ,000 ,000 ,000 ,000 ,000 1,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,193 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,6306100 ,5124735 ,6525398 -,0886820 ,3880884 ,1356864 ,3300902 ,6047978 ,3061259 ,2442689 -,0250211 ,2209468 ,1029813 ,2429958 -,5002752 -,4359203 -,2736459 -,0791402 ,1953170 -,1030787 ,5020416 ,2324100 ,4781270 ,3603963 ,5003383 -,2452008 -,1789624 ,2357140 ,1786639 ,4527480 ,1547662 ,3093364 ,0395681 ,2851913 ,1675481 ,3074626 -,4387975 -,3719772 ,0428011 -,2087547 ,6792955 ,5581739 ,6990973 ,1756203 ,4359203 ,1789624 ,3719772 ,6503154 ,3476771 ,2809141 ,0154470 ,2649501 ,1436574 ,2846325 -,2367952 -,3880884 -,2357140 -,0428011 ,2357875 -,0671271 ,5325014 ,2673758 ,5171298 ,3956024 ,5366500 ,0174903 -,1356864 ,2736459 ,2087547 ,4877164 ,1843879 ,3377880 ,0727991 ,3226469 ,2010319 ,3421070 -,1763316 -,3300902 ,0791402 -,1786639 11 12 11 12 1 2 3 4 5 6 7 8 9 10 12 1 2 3 4 5 6 7 8 9 10 11 ,27652290 -,02413223 ,04703926 -,22033930 ,02739620 -,09223289 ,04826192 -,58408744 -,62755660 -,21555225 -,47023221 -,27652290 -,30065513 ,34769440 ,08031583 ,32805133 ,20842224 ,34891705 -,28343231 -,32690147 ,08510288 -,16957708 ,02413223 ,30065513 ,00374615 ,00310575 ,00378385 ,00425009 ,00467521 ,00427523 ,00439116 ,02965349 ,00513079 ,00456188 ,00394168 ,00374615 ,00369834 ,00315112 ,00369802 ,00417967 ,00372688 ,00385932 ,02957941 ,00468369 ,00405250 ,00333899 ,00310575 ,00369834 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,2599060 -,0379085 ,0302551 -,2391916 ,0066582 -,1111967 ,0287839 -,7156223 -,6503154 -,2357875 -,4877164 -,2931398 -,3170600 ,3337169 ,0639124 ,3095115 ,1918908 ,3317982 -,4146385 -,3476771 ,0671271 -,1843879 ,0103560 ,2842503 ,2931398 -,0103560 ,0638234 -,2014870 ,0481342 -,0732691 ,0677399 -,4525526 -,6047978 -,1953170 -,4527480 -,2599060 -,2842503 ,3616719 ,0967192 ,3465912 ,2249537 ,3660359 -,1522261 -,3061259 ,1030787 -,1547662 ,0379085 ,3170600 Fuente: PASW 18.0. Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable dependiente. Se observa que los grupos 5, 1, 3 y 11 no son significativamente diferentes (“valor p” mínimo α= 0.212). Aquí se observa más claramente que los únicos grupos de ventas cuyas medias difieren entre sí son; 1, 3, 4, 5, 6, 7, 8, 9, 11 y 12. 211 Fuente: PASW 18.0. ix. ANOVA PARA TRECE GRUPOS Fuente: PASW 18.0. En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son homogéneas. Si ello es así, se puede proceder con el análisis de varianza. Fuente: PASW 18.0. 212 La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente (grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La sexta columna, denominada sig., presenta el “valor p” o mínimo de rechazo de la hipótesis de igualdad de las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo un bajo riesgo de cometer una equivocación. La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 13 niveles del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 5, 6, 7, 8 y 9, 10, 11 y 12 son significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000, menor que 0,05). Distancia del caso desde su centro inicial de clasificación Scheffé (I) Número inicial de casos 1 2 (J) Número inicial de casos 2 3 4 5 6 7 8 9 10 11 12 13 1 3 4 5 6 7 8 9 Diferencia de medias (I-J) Error típico Sig. ,47189668 ,06728601 ,46015479 ,14161380 -,16327846 ,23115847 ,45518906 -,20233021 ,18090997 ,21706703 ,47583327 ,26722678 -,47189668 -,40461067 -,01174189 -,33028288 -,63517514 -,24073821 -,01670762 -,67422690 ,00419204 ,00395147 ,00404749 ,00349564 ,02947725 ,00405571 ,00438557 ,00493270 ,00383829 ,00433274 ,00351264 ,00400613 ,00419204 ,00436313 ,00445027 ,00395503 ,02953525 ,00445775 ,00475983 ,00526824 ,000 ,000 ,000 ,000 ,002 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,860 ,000 ,000 ,000 ,420 ,000 213 Intervalo de confianza al 95% Límite Límite inferior superior ,4526741 ,4911192 ,0491666 ,0854054 ,4415951 ,4787145 ,1255846 ,1576430 -,2984459 -,0281110 ,2125611 ,2497559 ,4350791 ,4752990 -,2249490 -,1797114 ,1633095 ,1985104 ,1971993 ,2369347 ,4597261 ,4919404 ,2488567 ,2855968 -,4911192 -,4526741 -,4246177 -,3846036 -,0321485 ,0086648 -,3484186 -,3121471 -,7706086 -,4997417 -,2611792 -,2202973 -,0385338 ,0051185 -,6983843 -,6500695 3 4 5 10 11 12 13 1 2 4 5 6 7 8 9 10 11 12 13 1 2 3 5 6 7 8 9 10 11 12 13 1 2 3 4 6 7 8 9 10 11 12 13 -,29098671 -,25482966 ,00393659 -,20466990 -,06728601 ,40461067 ,39286878 ,07432779 -,23056447 ,16387246 ,38790305 -,26961623 ,11362396 ,14978101 ,40854726 ,19994077 -,46015479 ,01174189 -,39286878 -,31854099 -,62343325 -,22899632 -,00496573 -,66248501 -,27924482 -,24308777 ,01567848 -,19292801 -,14161380 ,33028288 -,07432779 ,31854099 -,30489226 ,08954467 ,31357526 -,34394402 ,03929617 ,07545322 ,33421947 ,12561297 214 ,00426090 ,00471120 ,00397006 ,00441270 ,00395147 ,00436313 ,00422443 ,00369908 ,02950206 ,00423231 ,00454938 ,00507890 ,00402445 ,00449848 ,00371514 ,00418482 ,00404749 ,00445027 ,00422443 ,00380148 ,02951508 ,00432209 ,00463303 ,00515395 ,00411876 ,00458305 ,00381711 ,00427561 ,00349564 ,00395503 ,00369908 ,00380148 ,02944448 ,00381023 ,00415960 ,00473293 ,00357793 ,00410387 ,00322610 ,00375742 ,000 ,000 1,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,860 ,000 ,000 ,000 ,000 1,000 ,000 ,000 ,000 ,155 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 -,3105250 -,2764328 -,0142681 -,2249042 -,0854054 ,3846036 ,3734977 ,0573657 -,3658457 ,1444653 ,3670419 -,2929054 ,0951699 ,1291533 ,3915115 ,1807513 -,4787145 -,0086648 -,4122398 -,3359726 -,7587742 -,2488152 -,0262104 -,6861184 -,2981313 -,2641033 -,0018248 -,2125337 -,1576430 ,3121471 -,0912899 ,3011094 -,4399095 ,0720729 ,2945015 -,3656468 ,0228896 ,0566350 ,3194262 ,1083834 -,2714484 -,2332265 ,0221413 -,1844356 -,0491666 ,4246177 ,4122398 ,0912899 -,0952832 ,1832796 ,4087642 -,2463270 ,1320780 ,1704087 ,4255830 ,2191302 -,4415951 ,0321485 -,3734977 -,3011094 -,4880923 -,2091774 ,0162789 -,6388516 -,2603583 -,2220723 ,0331818 -,1733223 -,1255846 ,3484186 -,0573657 ,3359726 -,1698751 ,1070164 ,3326491 -,3222412 ,0557027 ,0942714 ,3490127 ,1428425 6 7 8 9 1 2 3 4 5 7 8 9 10 11 12 13 1 2 3 4 5 6 8 9 10 11 12 13 1 2 3 4 5 6 7 9 10 11 12 13 1 2 3 4 ,16327846 ,63517514 ,23056447 ,62343325 ,30489226 ,39443693 ,61846752 -,03905175 ,34418843 ,38034548 ,63911173 ,43050524 -,23115847 ,24073821 -,16387246 ,22899632 -,08954467 -,39443693 ,22403059 -,43348869 -,05024850 -,01409145 ,24467480 ,03606831 -,45518906 ,01670762 -,38790305 ,00496573 -,31357526 -,61846752 -,22403059 -,65751928 -,27427909 -,23812204 ,02064421 -,18796229 ,20233021 ,67422690 ,26961623 ,66248501 215 ,02947725 ,02953525 ,02950206 ,02951508 ,02944448 ,02951621 ,02956334 ,02964944 ,02948712 ,02955555 ,02944650 ,02950943 ,00405571 ,00445775 ,00423231 ,00432209 ,00381023 ,02951621 ,00464021 ,00516041 ,00412684 ,00459031 ,00382583 ,00428339 ,00438557 ,00475983 ,00454938 ,00463303 ,00415960 ,02956334 ,00464021 ,00542350 ,00445144 ,00488420 ,00417390 ,00459694 ,00493270 ,00526824 ,00507890 ,00515395 ,002 ,000 ,000 ,000 ,000 ,000 ,000 1,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,666 ,000 ,000 ,000 ,420 ,000 1,000 ,000 ,000 ,000 ,000 ,000 ,000 ,018 ,000 ,000 ,000 ,000 ,000 ,0281110 ,4997417 ,0952832 ,4880923 ,1698751 ,2590908 ,4829053 -,1750088 ,2089757 ,2448190 ,5040853 ,2951902 -,2497559 ,2202973 -,1832796 ,2091774 -,1070164 -,5297830 ,2027530 -,4571517 -,0691721 -,0351403 ,2271315 ,0164269 -,4752990 -,0051185 -,4087642 -,0162789 -,3326491 -,7540297 -,2453082 -,6823886 -,2946911 -,2605185 ,0015049 -,2090415 ,1797114 ,6500695 ,2463270 ,6388516 ,2984459 ,7706086 ,3658457 ,7587742 ,4399095 ,5297830 ,7540297 ,0969053 ,4794012 ,5158720 ,7741382 ,5658203 -,2125611 ,2611792 -,1444653 ,2488152 -,0720729 -,2590908 ,2453082 -,4098257 -,0313249 ,0069574 ,2622181 ,0557097 -,4350791 ,0385338 -,3670419 ,0262104 -,2945015 -,4829053 -,2027530 -,6326499 -,2538671 -,2157256 ,0397835 -,1668831 ,2249490 ,6983843 ,2929054 ,6861184 10 11 12 5 6 7 8 10 11 12 13 1 2 3 4 5 6 7 8 9 11 12 13 1 2 3 4 5 6 7 8 9 10 12 13 1 2 3 4 5 6 7 8 ,34394402 ,03905175 ,43348869 ,65751928 ,38324019 ,41939724 ,67816348 ,46955699 -,18090997 ,29098671 -,11362396 ,27924482 -,03929617 -,34418843 ,05024850 ,27427909 -,38324019 ,03615705 ,29492330 ,08631680 -,21706703 ,25482966 -,14978101 ,24308777 -,07545322 -,38034548 ,01409145 ,23812204 -,41939724 -,03615705 ,25876625 ,05015975 -,47583327 -,00393659 -,40854726 -,01567848 -,33421947 -,63911173 -,24467480 -,02064421 216 ,00473293 ,02964944 ,00516041 ,00542350 ,00499135 ,00538087 ,00474549 ,00512154 ,00383829 ,00426090 ,00402445 ,00411876 ,00357793 ,02948712 ,00412684 ,00445144 ,00499135 ,00439940 ,00359454 ,00407813 ,00433274 ,00471120 ,00449848 ,00458305 ,00410387 ,02955555 ,00459031 ,00488420 ,00538087 ,00439940 ,00411835 ,00454657 ,00351264 ,00397006 ,00371514 ,00381711 ,00322610 ,02944650 ,00382583 ,00417390 ,000 1,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,666 ,000 ,000 ,000 ,000 ,000 ,000 1,000 ,000 ,155 ,000 ,000 ,000 ,018 ,3222412 -,0969053 ,4098257 ,6326499 ,3603524 ,3947234 ,6564031 ,4460722 -,1985104 ,2714484 -,1320780 ,2603583 -,0557027 -,4794012 ,0313249 ,2538671 -,4061280 ,0159837 ,2784406 ,0676166 -,2369347 ,2332265 -,1704087 ,2220723 -,0942714 -,5158720 -,0069574 ,2157256 -,4440711 -,0563304 ,2398816 ,0293115 -,4919404 -,0221413 -,4255830 -,0331818 -,3490127 -,7741382 -,2622181 -,0397835 ,3656468 ,1750088 ,4571517 ,6823886 ,4061280 ,4440711 ,6999239 ,4930417 -,1633095 ,3105250 -,0951699 ,2981313 -,0228896 -,2089757 ,0691721 ,2946911 -,3603524 ,0563304 ,3114060 ,1050170 -,1971993 ,2764328 -,1291533 ,2641033 -,0566350 -,2448190 ,0351403 ,2605185 -,3947234 -,0159837 ,2776509 ,0710080 -,4597261 ,0142681 -,3915115 ,0018248 -,3194262 -,5040853 -,2271315 -,0015049 13 9 10 11 13 1 2 3 4 5 6 7 8 9 10 11 12 -,67816348 -,29492330 -,25876625 -,20860649 -,26722678 ,20466990 -,19994077 ,19292801 -,12561297 -,43050524 -,03606831 ,18796229 -,46955699 -,08631680 -,05015975 ,20860649 Fuente: PASW 18.0. Fuente: PASW 18.0. 217 ,00474549 ,00359454 ,00411835 ,00377323 ,00400613 ,00441270 ,00418482 ,00427561 ,00375742 ,02950943 ,00428339 ,00459694 ,00512154 ,00407813 ,00454657 ,00377323 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 -,6999239 -,3114060 -,2776509 -,2259086 -,2855968 ,1844356 -,2191302 ,1733223 -,1428425 -,5658203 -,0557097 ,1668831 -,4930417 -,1050170 -,0710080 ,1913044 -,6564031 -,2784406 -,2398816 -,1913044 -,2488567 ,2249042 -,1807513 ,2125337 -,1083834 -,2951902 -,0164269 ,2090415 -,4460722 -,0676166 -,0293115 ,2259086 Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable dependiente. En este caso, se observa que los grupos 7, 11 y 10 no son significativamente diferentes (“valor p” mínimo= 0.156) y los grupos 12, 2, 4, 8, 3 y 1 tampoco son significativamente diferentes entre sí (valor p mínimo = 1). Aquí se observa claramente que los únicos grupos cuyas medias difieren entre sí son: 12, 2, 4, 8, 13, 5, 3, 1, 6 y 9. x. ANOVA PARA CATORCE GRUPOS Fuente: PASW 18.0. En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son homogéneas. Si ello es así, se puede proceder con el análisis de varianza. Fuente: PASW 18.0. La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente (grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo un bajo riesgo de cometer una equivocación. La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 14 niveles del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o 218 desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 y 14 son significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000, menor que 0,05). Distancia del caso desde su centro inicial de clasificación Scheffé (I) Número inicial de casos 1 2 3 (J) Número inicial de casos 2 3 4 5 6 7 8 9 10 11 12 13 14 1 3 4 5 6 7 8 9 10 11 12 13 14 1 Diferencia de medias (I-J) Error típico Sig. -,04186290 -,72431360 -,36710700 -,24397295 -,29414723 -,42320644 -,35646254 -,08172785 -,32966204 -,68561714 -,04821372 -,48632238 -,06696186 ,04186290 -,68245070 -,32524409 -,20211005 -,25228433 -,38134354 -,31459964 -,03986494 -,28779914 -,64375423 -,00635082 -,44445948 -,02509895 ,72431360 ,00413088 ,00466970 ,00403192 ,00389129 ,00416050 ,00381082 ,00327695 ,00422299 ,00338326 ,02867232 ,00392441 ,00366267 ,00379233 ,00413088 ,00528424 ,00473006 ,00461077 ,00484014 ,00454307 ,00410555 ,00489395 ,00419089 ,02877879 ,00463876 ,00441953 ,00452757 ,00466970 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 1,000 ,000 ,004 ,000 219 Intervalo de confianza al 95% Límite Límite inferior superior -,0613975 -,0223283 -,7463962 -,7022310 -,3861736 -,3480404 -,2623745 -,2255714 -,3138219 -,2744725 -,4412275 -,4051854 -,3719590 -,3409661 -,1016980 -,0617577 -,3456612 -,3136629 -,8212062 -,5500280 -,0667719 -,0296555 -,5036428 -,4690019 -,0848955 -,0490282 ,0223283 ,0613975 -,7074395 -,6574619 -,3476122 -,3028760 -,2239140 -,1803061 -,2751730 -,2293957 -,4028274 -,3598597 -,3340145 -,2951848 -,0630081 -,0167218 -,3076175 -,2679807 -,7798468 -,5076616 -,0282872 ,0155855 -,4653591 -,4235599 -,0465095 -,0036884 ,7022310 ,7463962 4 5 6 2 4 5 6 7 8 9 10 11 12 13 14 1 2 3 5 6 7 8 9 10 11 12 13 14 1 2 3 4 6 7 8 9 10 11 12 13 14 1 2 ,68245070 ,35720661 ,48034065 ,43016637 ,30110716 ,36785106 ,64258576 ,39465156 ,03869647 ,67609988 ,23799122 ,65735175 ,36710700 ,32524409 -,35720661 ,12313404 ,07295976 -,05609945 ,01064445 ,28537915 ,03744496 -,31851014 ,31889327 -,11921539 ,30014514 ,24397295 ,20211005 -,48034065 -,12313404 -,05017428 -,17923349 -,11248959 ,16224510 -,08568909 -,44164419 ,19575923 -,24234943 ,17701110 ,29414723 ,25228433 220 ,00528424 ,00520724 ,00509913 ,00530743 ,00503799 ,00464731 ,00535655 ,00472287 ,02886106 ,00512445 ,00492688 ,00502402 ,00403192 ,00473006 ,00520724 ,00452232 ,00475595 ,00445327 ,00400596 ,00481071 ,00409338 ,02876475 ,00455086 ,00432717 ,00443746 ,00389129 ,00461077 ,00509913 ,00452232 ,00463733 ,00432636 ,00386439 ,00469347 ,00395494 ,02874538 ,00442674 ,00419645 ,00431009 ,00416050 ,00484014 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 1,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,899 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,6574619 ,3325820 ,4562273 ,4050679 ,2772829 ,3458743 ,6172550 ,3723175 -,0977852 ,6518667 ,2146924 ,6335935 ,3480404 ,3028760 -,3818312 ,1017483 ,0504692 -,0771586 -,0082994 ,2626297 ,0180877 -,4545364 ,2973726 -,1396782 ,2791607 ,2255714 ,1803061 -,5044540 -,1445198 -,0721039 -,1996925 -,1307640 ,1400500 -,1043917 -,5775788 ,1748255 -,2621941 ,1566290 ,2744725 ,2293957 ,7074395 ,3818312 ,5044540 ,4552648 ,3249314 ,3898278 ,6679165 ,4169856 ,1751781 ,7003330 ,2612901 ,6811100 ,3861736 ,3476122 -,3325820 ,1445198 ,0954503 -,0350403 ,0295883 ,3081286 ,0568022 -,1824839 ,3404139 -,0987525 ,3211296 ,2623745 ,2239140 -,4562273 -,1017483 -,0282447 -,1587745 -,0942152 ,1844402 -,0669865 -,3057096 ,2166929 -,2225048 ,1973932 ,3138219 ,2751730 7 8 9 3 4 5 7 8 9 10 11 12 13 14 1 2 3 4 5 6 8 9 10 11 12 13 14 1 2 3 4 5 6 7 9 10 11 12 13 14 1 2 3 -,43016637 -,07295976 ,05017428 -,12905921 -,06231531 ,21241938 -,03551481 -,39146990 ,24593351 -,19217515 ,22718538 ,42320644 ,38134354 -,30110716 ,05609945 ,17923349 ,12905921 ,06674390 ,34147859 ,09354440 -,26241070 ,37499272 -,06311594 ,35624459 ,35646254 ,31459964 -,36785106 -,01064445 ,11248959 ,06231531 -,06674390 ,27473469 ,02680050 -,32915460 ,30824882 -,12985984 ,28950068 ,08172785 ,03986494 -,64258576 221 ,00530743 ,00475595 ,00463733 ,00457002 ,00413536 ,00491898 ,00422010 ,02878306 ,00466516 ,00444723 ,00455462 ,00381082 ,00454307 ,00503799 ,00445327 ,00432636 ,00457002 ,00378335 ,00462698 ,00387579 ,02873460 ,00435618 ,00412195 ,00423758 ,00327695 ,00410555 ,00464731 ,00400596 ,00386439 ,00413536 ,00378335 ,00419822 ,00335229 ,02866868 ,00389774 ,00363408 ,00376473 ,00422299 ,00489395 ,00535655 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,899 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 -,4552648 -,0954503 ,0282447 -,1506705 -,0818711 ,1891579 -,0554713 -,5275827 ,2238723 -,2132058 ,2056470 ,4051854 ,3598597 -,3249314 ,0350403 ,1587745 ,1074479 ,0488527 ,3195980 ,0752161 -,3982943 ,3543927 -,0826083 ,3362054 ,3409661 ,2951848 -,3898278 -,0295883 ,0942152 ,0427595 -,0846351 ,2548817 ,0109478 -,4647265 ,2898167 -,1470451 ,2716976 ,0617577 ,0167218 -,6679165 -,4050679 -,0504692 ,0721039 -,1074479 -,0427595 ,2356809 -,0155583 -,2553571 ,2679947 -,1711445 ,2487238 ,4412275 ,4028274 -,2772829 ,0771586 ,1996925 ,1506705 ,0846351 ,3633592 ,1118727 -,1265271 ,3955927 -,0436236 ,3762838 ,3719590 ,3340145 -,3458743 ,0082994 ,1307640 ,0818711 -,0488527 ,2945877 ,0426532 -,1935827 ,3266809 -,1126746 ,3073038 ,1016980 ,0630081 -,6172550 10 11 12 4 5 6 7 8 10 11 12 13 14 1 2 3 4 5 6 7 8 9 11 12 13 14 1 2 3 4 5 6 7 8 9 10 12 13 14 1 2 3 4 -,28537915 -,16224510 -,21241938 -,34147859 -,27473469 -,24793419 -,60388929 ,03351413 -,40459454 ,01476599 ,32966204 ,28779914 -,39465156 -,03744496 ,08568909 ,03551481 -,09354440 -,02680050 ,24793419 -,35595510 ,28144832 -,15666034 ,26270018 ,68561714 ,64375423 -,03869647 ,31851014 ,44164419 ,39146990 ,26241070 ,32915460 ,60388929 ,35595510 ,63740341 ,19929475 ,61865528 ,04821372 ,00635082 -,67609988 -,31889327 222 ,00481071 ,00469347 ,00491898 ,00462698 ,00419822 ,00428171 ,02879216 ,00472097 ,00450574 ,00461176 ,00338326 ,00419089 ,00472287 ,00409338 ,00395494 ,00422010 ,00387579 ,00335229 ,00428171 ,02868102 ,00398753 ,00373022 ,00385761 ,02867232 ,02877879 ,02886106 ,02876475 ,02874538 ,02878306 ,02873460 ,02866868 ,02879216 ,02868102 ,02874988 ,02871532 ,02873215 ,00392441 ,00463876 ,00512445 ,00455086 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,673 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 1,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 1,000 ,000 ,000 -,3081286 -,1844402 -,2356809 -,3633592 -,2945877 -,2681821 -,7400451 ,0111890 -,4259018 -,0070427 ,3136629 ,2679807 -,4169856 -,0568022 ,0669865 ,0155583 -,1118727 -,0426532 ,2276863 -,4915854 ,2625916 -,1743003 ,2444578 ,5500280 ,5076616 -,1751781 ,1824839 ,3057096 ,2553571 ,1265271 ,1935827 ,4677335 ,2203248 ,5014475 ,0635023 ,4827832 ,0296555 -,0155855 -,7003330 -,3404139 -,2626297 -,1400500 -,1891579 -,3195980 -,2548817 -,2276863 -,4677335 ,0558392 -,3832872 ,0365747 ,3456612 ,3076175 -,3723175 -,0180877 ,1043917 ,0554713 -,0752161 -,0109478 ,2681821 -,2203248 ,3003050 -,1390204 ,2809425 ,8212062 ,7798468 ,0977852 ,4545364 ,5775788 ,5275827 ,3982943 ,4647265 ,7400451 ,4915854 ,7733593 ,3350872 ,7545273 ,0667719 ,0282872 -,6518667 -,2973726 13 14 5 6 7 8 9 10 11 13 14 1 2 3 4 5 6 7 8 9 10 11 12 14 1 2 3 4 5 6 7 8 9 10 11 12 13 -,19575923 -,24593351 -,37499272 -,30824882 -,03351413 -,28144832 -,63740341 -,43810866 -,01874813 ,48632238 ,44445948 -,23799122 ,11921539 ,24234943 ,19217515 ,06311594 ,12985984 ,40459454 ,15666034 -,19929475 ,43810866 ,41936053 ,06696186 ,02509895 -,65735175 -,30014514 -,17701110 -,22718538 -,35624459 -,28950068 -,01476599 -,26270018 -,61865528 ,01874813 -,41936053 Fuente: PASW 18.0. 223 ,00442674 ,00466516 ,00435618 ,00389774 ,00472097 ,00398753 ,02874988 ,00422718 ,00434001 ,00366267 ,00441953 ,00492688 ,00432717 ,00419645 ,00444723 ,00412195 ,00363408 ,00450574 ,00373022 ,02871532 ,00422718 ,00410486 ,00379233 ,00452757 ,00502402 ,00443746 ,00431009 ,00455462 ,00423758 ,00376473 ,00461176 ,00385761 ,02873215 ,00434001 ,00410486 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,134 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,004 ,000 ,000 ,000 ,000 ,000 ,000 ,673 ,000 ,000 ,134 ,000 -,2166929 -,2679947 -,3955927 -,3266809 -,0558392 -,3003050 -,7733593 -,4580987 -,0392717 ,4690019 ,4235599 -,2612901 ,0987525 ,2225048 ,1711445 ,0436236 ,1126746 ,3832872 ,1390204 -,3350872 ,4181187 ,3999490 ,0490282 ,0036884 -,6811100 -,3211296 -,1973932 -,2487238 -,3762838 -,3073038 -,0365747 -,2809425 -,7545273 -,0017754 -,4387721 -,1748255 -,2238723 -,3543927 -,2898167 -,0111890 -,2625916 -,5014475 -,4181187 ,0017754 ,5036428 ,4653591 -,2146924 ,1396782 ,2621941 ,2132058 ,0826083 ,1470451 ,4259018 ,1743003 -,0635023 ,4580987 ,4387721 ,0848955 ,0465095 -,6335935 -,2791607 -,1566290 -,2056470 -,3362054 -,2716976 ,0070427 -,2444578 -,4827832 ,0392717 -,3999490 Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable dependiente. En este caso, se observa que los grupos 5 y 6 no son significativamente diferentes (“valor p” mínimo= 0.132). Aquí se observa claramente que los grupos cuyas medias no difieren entre sí son: 1, 14, 9, 5, 8, 4, 7, 13, 11, 3. Fuente: PASW 18.0. xi. ANOVA PARA QUINCE GRUPOS Fuente: PASW 18.0. En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son homogéneas. Si ello es así, se puede proceder con el análisis de varianza. 224 Fuente: PASW 18.0. La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente (grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo un bajo riesgo de cometer una equivocación. La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 15 niveles del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 y 14 y 15 son significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000, menor que 0,05). Distancia del caso desde su centro inicial de clasificación Scheffé (I) Número inicial de casos 1 (J) Número inicial de casos 2 3 4 5 6 7 8 9 10 11 Diferencia de medias (I-J) Error típico Sig. -,04124279 -,10152903 -,16429138 -,35108151 -,30263205 -,61323887 -,41340040 -,54845597 ,03229576 -,08000721 ,00451724 ,00455381 ,00415103 ,00439685 ,00418253 ,00616082 ,00436855 ,00668992 ,00396016 ,00463649 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 225 Intervalo de confianza al 95% Límite Límite inferior superior -,0632272 -,0192584 -,1236914 -,0793666 -,1844935 -,1440892 -,3724800 -,3296830 -,3229875 -,2822766 -,6432222 -,5832555 -,4346611 -,3921397 -,5810143 -,5158976 ,0130226 ,0515690 -,1025720 -,0574424 2 3 4 12 13 14 15 1 3 4 5 6 7 8 9 10 11 12 13 14 15 1 2 4 5 6 7 8 9 10 11 12 13 14 15 1 2 3 5 6 7 8 9 -,21548831 -,28824763 -,36122962 -,51371426 ,04124279 -,06028624 -,12304859 -,30983872 -,26138926 -,57199608 -,37215761 -,50721318 ,07353856 -,03876442 -,17424551 -,24700483 -,31998683 -,47247147 ,10152903 ,06028624 -,06276235 -,24955248 -,20110303 -,51170984 -,31187137 -,44692694 ,13382479 ,02152182 -,11395928 -,18671860 -,25970059 -,41218524 ,16429138 ,12304859 ,06276235 -,18679013 -,13834067 -,44894749 -,24910902 -,38416459 226 ,00442233 ,00462632 ,00401946 ,00444297 ,00451724 ,00477336 ,00439077 ,00462386 ,00442056 ,00632483 ,00459695 ,00684126 ,00421077 ,00485230 ,00464809 ,00484258 ,00426659 ,00466773 ,00455381 ,00477336 ,00442838 ,00465960 ,00445792 ,00635101 ,00463289 ,00686546 ,00424998 ,00488637 ,00468364 ,00487671 ,00430530 ,00470314 ,00415103 ,00439077 ,00442838 ,00426681 ,00404561 ,00606870 ,00423764 ,00660518 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,150 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 -,2370108 -,3107629 -,3807914 -,5353372 ,0192584 -,0835171 -,1444175 -,3323420 -,2829031 -,6027776 -,3945299 -,5405081 ,0530457 -,0623795 -,1968667 -,2705726 -,3407514 -,4951883 ,0793666 ,0370554 -,0843143 -,2722297 -,2227987 -,5426188 -,3344186 -,4803396 ,1131411 -,0022590 -,1367535 -,2104525 -,2806535 -,4350743 ,1440892 ,1016797 ,0412104 -,2075558 -,1580297 -,4784825 -,2697326 -,4163105 -,1939658 -,2657324 -,3416678 -,4920913 ,0632272 -,0370554 -,1016797 -,2873354 -,2398754 -,5412145 -,3497853 -,4739183 ,0940314 -,0151493 -,1516243 -,2234371 -,2992223 -,4497547 ,1236914 ,0835171 -,0412104 -,2268753 -,1794073 -,4808009 -,2893241 -,4135143 ,1545085 ,0453027 -,0911651 -,1629847 -,2387477 -,3892961 ,1844935 ,1444175 ,0843143 -,1660245 -,1186516 -,4194125 -,2284854 -,3520186 5 6 7 10 11 12 13 14 15 1 2 3 4 6 7 8 9 10 11 12 13 14 15 1 2 3 4 5 7 8 9 10 11 12 13 14 15 1 2 3 4 5 6 ,19658715 ,08428417 -,05119692 -,12395625 -,19693824 -,34942288 ,35108151 ,30983872 ,24955248 ,18679013 ,04844946 -,26215736 -,06231889 -,19737446 ,38337727 ,27107430 ,13559320 ,06283388 -,01014811 -,16263275 ,30263205 ,26138926 ,20110303 ,13834067 -,04844946 -,31060682 -,11076835 -,24582392 ,33492782 ,22262484 ,08714375 ,01438443 -,05859756 -,21108221 ,61323887 ,57199608 ,51170984 ,44894749 ,26215736 ,31060682 227 ,00381526 ,00451336 ,00429306 ,00450291 ,00387678 ,00431432 ,00439685 ,00462386 ,00465960 ,00426681 ,00429746 ,00623942 ,00447871 ,00676238 ,00408136 ,00474044 ,00453118 ,00473048 ,00413893 ,00455133 ,00418253 ,00442056 ,00445792 ,00404561 ,00429746 ,00609029 ,00426850 ,00662502 ,00384951 ,00454235 ,00432352 ,00453196 ,00391049 ,00434463 ,00616082 ,00632483 ,00635101 ,00606870 ,00623942 ,00609029 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,966 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,757 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,1780191 ,0623186 -,0720903 -,1458709 -,2158057 -,3704197 ,3296830 ,2873354 ,2268753 ,1660245 ,0275347 -,2925232 -,0841158 -,2302854 ,3635142 ,2480037 ,1135410 ,0398117 -,0302913 -,1847831 ,2822766 ,2398754 ,1794073 ,1186516 -,0693643 -,3402469 -,1315422 -,2780664 ,3161931 ,2005182 ,0661021 -,0076716 -,0776290 -,2322266 ,5832555 ,5412145 ,4808009 ,4194125 ,2317915 ,2809667 ,2151552 ,1062497 -,0303036 -,1020416 -,1780708 -,3284261 ,3724800 ,3323420 ,2722297 ,2075558 ,0693643 -,2317915 -,0405220 -,1644635 ,4032403 ,2941449 ,1576454 ,0858561 ,0099951 -,1404824 ,3229875 ,2829031 ,2227987 ,1580297 -,0275347 -,2809667 -,0899945 -,2135814 ,3536625 ,2447315 ,1081854 ,0364405 -,0395661 -,1899379 ,6432222 ,6027776 ,5426188 ,4784825 ,2925232 ,3402469 8 9 10 8 9 10 11 12 13 14 15 1 2 3 4 5 6 7 9 10 11 12 13 14 15 1 2 3 4 5 6 7 8 10 11 12 13 14 15 1 2 3 4 ,19983847 ,06478290 ,64553464 ,53323166 ,39775057 ,32499125 ,25200926 ,09952461 ,41340040 ,37215761 ,31187137 ,24910902 ,06231889 ,11076835 -,19983847 -,13505557 ,44569617 ,33339319 ,19791210 ,12515278 ,05217078 -,10031386 ,54845597 ,50721318 ,44692694 ,38416459 ,19737446 ,24582392 -,06478290 ,13505557 ,58075174 ,46844876 ,33296767 ,26020835 ,18722635 ,03474171 -,03229576 -,07353856 -,13382479 -,19658715 228 ,00621951 ,00802204 ,00593977 ,00641055 ,00625740 ,00640319 ,00597948 ,00627200 ,00436855 ,00459695 ,00463289 ,00423764 ,00447871 ,00426850 ,00621951 ,00674400 ,00405084 ,00471419 ,00450372 ,00470418 ,00410884 ,00452399 ,00668992 ,00684126 ,00686546 ,00660518 ,00676238 ,00662502 ,00802204 ,00674400 ,00648693 ,00692058 ,00677896 ,00691377 ,00652330 ,00679245 ,00396016 ,00421077 ,00424998 ,00381526 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,025 ,000 ,000 ,000 ,000 ,1695695 ,0257414 ,6166271 ,5020330 ,3672972 ,2938283 ,2229085 ,0690002 ,3921397 ,3497853 ,2893241 ,2284854 ,0405220 ,0899945 -,2301074 -,1678771 ,4259816 ,3104503 ,1759935 ,1022586 ,0321740 -,1223311 ,5158976 ,4739183 ,4135143 ,3520186 ,1644635 ,2135814 -,1038244 ,1022340 ,5491813 ,4347678 ,2999760 ,2265606 ,1554789 ,0016844 -,0515690 -,0940314 -,1545085 -,2151552 ,2301074 ,1038244 ,6744422 ,5644304 ,4282039 ,3561541 ,2811100 ,1300490 ,4346611 ,3945299 ,3344186 ,2697326 ,0841158 ,1315422 -,1695695 -,1022340 ,4654107 ,3563361 ,2198307 ,1480470 ,0721676 -,0782966 ,5810143 ,5405081 ,4803396 ,4163105 ,2302854 ,2780664 -,0257414 ,1678771 ,6123222 ,5021297 ,3659594 ,2938561 ,2189738 ,0677990 -,0130226 -,0530457 -,1131411 -,1780191 11 12 13 5 6 7 8 9 11 12 13 14 15 1 2 3 4 5 6 7 8 9 10 12 13 14 15 1 2 3 4 5 6 7 8 9 10 11 13 14 15 1 2 -,38337727 -,33492782 -,64553464 -,44569617 -,58075174 -,11230297 -,24778407 -,32054339 -,39352538 -,54601003 ,08000721 ,03876442 -,02152182 -,08428417 -,27107430 -,22262484 -,53323166 -,33339319 -,46844876 ,11230297 -,13548110 -,20824042 -,28122241 -,43370706 ,21548831 ,17424551 ,11395928 ,05119692 -,13559320 -,08714375 -,39775057 -,19791210 -,33296767 ,24778407 ,13548110 -,07275932 -,14574131 -,29822596 ,28824763 ,24700483 229 ,00408136 ,00384951 ,00593977 ,00405084 ,00648693 ,00433846 ,00410879 ,00432758 ,00367168 ,00413100 ,00463649 ,00485230 ,00488637 ,00451336 ,00474044 ,00454235 ,00641055 ,00471419 ,00692058 ,00433846 ,00476407 ,00495401 ,00439266 ,00478324 ,00442233 ,00464809 ,00468364 ,00429306 ,00453118 ,00432352 ,00625740 ,00450372 ,00677896 ,00410879 ,00476407 ,00475416 ,00416597 ,00457594 ,00462632 ,00484258 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,150 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 -,4032403 -,3536625 -,6744422 -,4654107 -,6123222 -,1334173 -,2677806 -,3416048 -,4113946 -,5661147 ,0574424 ,0151493 -,0453027 -,1062497 -,2941449 -,2447315 -,5644304 -,3563361 -,5021297 ,0911887 -,1586668 -,2323505 -,3026005 -,4569860 ,1939658 ,1516243 ,0911651 ,0303036 -,1576454 -,1081854 -,4282039 -,2198307 -,3659594 ,2277875 ,1122954 -,0958968 -,1660162 -,3204960 ,2657324 ,2234371 -,3635142 -,3161931 -,6166271 -,4259816 -,5491813 -,0911887 -,2277875 -,2994820 -,3756561 -,5259054 ,1025720 ,0623795 ,0022590 -,0623186 -,2480037 -,2005182 -,5020330 -,3104503 -,4347678 ,1334173 -,1122954 -,1841304 -,2598443 -,4104281 ,2370108 ,1968667 ,1367535 ,0720903 -,1135410 -,0661021 -,3672972 -,1759935 -,2999760 ,2677806 ,1586668 -,0496219 -,1254664 -,2759559 ,3107629 ,2705726 14 15 3 4 5 6 7 8 9 10 11 12 14 15 1 2 3 4 5 6 7 8 9 10 11 12 13 15 1 2 3 4 5 6 7 8 9 10 11 12 13 14 ,18671860 ,12395625 -,06283388 -,01438443 -,32499125 -,12515278 -,26020835 ,32054339 ,20824042 ,07275932 -,07298199 -,22546664 ,36122962 ,31998683 ,25970059 ,19693824 ,01014811 ,05859756 -,25200926 -,05217078 -,18722635 ,39352538 ,28122241 ,14574131 ,07298199 -,15248465 ,51371426 ,47247147 ,41218524 ,34942288 ,16263275 ,21108221 -,09952461 ,10031386 -,03474171 ,54601003 ,43370706 ,29822596 ,22546664 ,15248465 Fuente: PASW 18.0. 230 ,00487671 ,00450291 ,00473048 ,00453196 ,00640319 ,00470418 ,00691377 ,00432758 ,00495401 ,00475416 ,00438192 ,00477337 ,00401946 ,00426659 ,00430530 ,00387678 ,00413893 ,00391049 ,00597948 ,00410884 ,00652330 ,00367168 ,00439266 ,00416597 ,00438192 ,00418788 ,00444297 ,00466773 ,00470314 ,00431432 ,00455133 ,00434463 ,00627200 ,00452399 ,00679245 ,00413100 ,00478324 ,00457594 ,00477337 ,00418788 ,000 ,000 ,000 ,757 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,966 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,025 ,000 ,000 ,000 ,000 ,000 ,1629847 ,1020416 -,0858561 -,0364405 -,3561541 -,1480470 -,2938561 ,2994820 ,1841304 ,0496219 -,0943078 -,2486976 ,3416678 ,2992223 ,2387477 ,1780708 -,0099951 ,0395661 -,2811100 -,0721676 -,2189738 ,3756561 ,2598443 ,1254664 ,0516562 -,1728661 ,4920913 ,4497547 ,3892961 ,3284261 ,1404824 ,1899379 -,1300490 ,0782966 -,0677990 ,5259054 ,4104281 ,2759559 ,2022357 ,1321032 ,2104525 ,1458709 -,0398117 ,0076716 -,2938283 -,1022586 -,2265606 ,3416048 ,2323505 ,0958968 -,0516562 -,2022357 ,3807914 ,3407514 ,2806535 ,2158057 ,0302913 ,0776290 -,2229085 -,0321740 -,1554789 ,4113946 ,3026005 ,1660162 ,0943078 -,1321032 ,5353372 ,4951883 ,4350743 ,3704197 ,1847831 ,2322266 -,0690002 ,1223311 -,0016844 ,5661147 ,4569860 ,3204960 ,2486976 ,1728661 Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable dependiente. En este caso, se observa que los grupos 11 y 3 no son significativamente diferentes (“valor p” mínimo= 0.201). Aquí se observa claramente que en todos los grupos las medias difieren entre sí. Fuente: PASW 18.0. Después de realizar el ANOVA para el número de grupos entre cinco y quince, se puede concluir que el número óptimo de grupos debe ser alrededor de diez, ya que se espera que éstos sean suficientes para describir adecuadamente los comportamientos más relevantes de los tarjetahabientes, además que después de este número, los grupos empiezan a presentar semejanzas entre ellos35. Se concluye que el número adecuado de grupos es ocho, ya que en esta cantidad de grupos, el ANOVA no muestra mayor homogeneidad intergrupal. Igualmente se espera que no se presente un crecimiento desproporcionado al combinarlo con las variables RAM y las variables demográficas, permitiendo que el análisis sea adecuado. No menos que ocho pues se quedarían algunos grupos de interés por fuera del análisis. 35 Se buscan grupos heterogéneos entre ellos. 231 ANEXO I. Análisis de Conglomerados de K medias. A continuación se presentan los centros de los conglomerados finales y las tablas de contingencia entre las variables nominales: Calificación, MCC, conglomerados RAM, edad, género, estado civil y ocupación, y los conglomerados finales. A cada una de ellas se le han destacado los valores que permiten la caracterización de los clientes en cada uno de los conglomerados. • × Conglomerados finales Número de iteraciones ejecutadas y convergencia de los centros iniciales. Fuente: PASW 18.0 Lo anterior implica que se halló la solución óptima y no trivial en la iteración 56. × Centro de conglomerados finales. La siguiente tabla presenta la distancia final de los centros de cada una de las variables, en cada uno de los ocho grupos encontrados. Los campos sombreados con rojo indican los mayores valores en cada uno de los conglomerados, los campos sombreados con rojo y en negrita indican los valores más altos por fila y columna conjuntamente. Centros de los conglomerados finales 1 2 3 CONGLOMERADO 4 5 6 7 8 Puntua(NoTrxDeclinadas) 1,51824 ,02533 -,09026 -,52388 ,26565 -,90324 1,70496 -,53661 Puntua(porcVisaNal1) -,84904 ,05768 ,06654 -1,08169 ,11105 -,08696 ,27701 -1,08169 Puntua(porcMasterNal1) -1,25955 ,13633 ,08940 -1,48970 ,21667 -,19429 ,39321 -1,48970 Puntua(porcTrxNal1) -3,56257 ,21271 ,20955 -4,49066 ,19758 ,26681 ,15664 -4,49066 Puntua(porcMañana) ,21436 ,00562 -,00326 -,31844 ,15626 -,32220 ,58927 -,36866 Puntua(porcTarde) -,02271 ,10966 -,78491 ,16357 -,24433 ,33549 -,82047 ,07496 232 Puntua(porcLun) ,50492 -,05315 ,02051 -,15032 ,10002 -,30058 ,60683 -,14206 Puntua(porcMart) ,69018 -,07057 -,00694 -,14860 ,10437 -,30158 ,61959 -,06883 Puntua(porcMier) ,66161 -,03681 -,08984 -,11893 ,08018 -,29362 ,64757 -,17390 Puntua(porcJue) ,67490 -,01988 -,08541 -,10569 ,06086 -,29091 ,62874 -,13711 Puntua(porcVier) ,63364 -,01678 -,03709 -,16125 ,06298 -,30391 ,63810 -,19557 Puntua(porcSab) ,24566 -,00579 ,00006 -,23583 ,16086 -,27864 ,48821 -,35553 Puntua(porcFebr) ,26587 ,04367 -,23618 -,19775 ,01787 -,19215 ,51883 -,22185 Puntua(porcMarz) ,28861 -,27289 -,28108 -,21334 ,48173 -,19017 ,44886 -,18943 Puntua(porcAbri) ,23818 -,44959 -,32055 -,20061 ,82625 -,18549 ,30658 -,15151 Puntua(porcMay) ,20129 -,45508 -,32388 -,12185 ,85807 -,16731 ,23383 -,15966 Puntua(porcJun) ,28289 ,16425 -,37136 -,04539 ,01722 -,17398 ,34847 -,11561 Puntua(porcJul) ,21802 ,19449 -,20651 -,10860 -,27253 -,16436 ,54709 -,13058 Puntua(porcAgos) ,18890 ,19388 -,18730 -,15928 -,28961 -,17605 ,59517 -,15998 Puntua(porcSepti) ,16393 ,15616 -,16137 -,17875 -,28116 -,17564 ,63163 -,17750 Puntua(porcOctu) ,22882 ,11895 -,07499 -,19785 -,28484 -,18333 ,64460 -,13185 Puntua(porcNovi) ,30870 -,43969 2,5377 -,15332 -,38928 -,44206 ,53614 -,11573 Puntua(porcDici) ,16261 ,20993 -,09865 -,28096 -,25588 -,15556 ,46000 -,27723 Puntua(promDeclinado1) ,53218 -,03686 -,02610 -,46077 -,08279 ,03640 -,14097 1,57667 Puntua(desvEstandar) ,91747 ,69991 ,19433 -,49626 ,71996 -1,27765 ,79808 -,29595 Puntua(porcExtraCupo1) ,98082 ,03581 -,06584 -1,20640 ,14078 -,47160 ,84818 ,37047 Fuente: PASW 18.0 De lo anterior se puede concluir que las características más relevantes que presentan cada uno de los conglomerados son: • Conglomerado 1: Muchas transacciones internacionales, alta variabilidad en los montos declinados y porcentajes de extra cupos altos. 233 • × • Conglomerado 2: No presenta parámetros relevantes. • Conglomerado 3: Transacciones frecuentes en noviembre y no mucho en junio. • Conglomerado 4: Transacciones internacionales con porcentaje de extra cupos bajos y de no preferencia en la tarde. • Conglomerado 5: Transacciones frecuentes en marzo, abril, mayo con alta variabilidad en los motos declinados. • Conglomerado 6: Pocas transacciones declinadas y no variabilidad en los montos declinados. • Conglomerado 7: Muchas transacciones declinadas, porcentajes de extra cupos altos y alta variabilidad en los montos declinados. • Conglomerado 8: Transacciones internacionales con altos promedios de declinación. Tablas de contingencia CON LA CALIFICACIÓN Fuente: PASW 18.0 Lo anterior implica que la prueba fue significativa al nivel 5%. La tabla de contingencia entre la calificación y los ocho conglomerados iniciales se muestran a continuación. Los valores sombreados con rojo indican los residuos tipificados más altos por variable, comparados contra el valor 25,02. En los casos en los que los residuos tipificados no alcanzan a ser mayores a este valor, se buscan los valores más altos por cada variable. Los valores sombreados con rojos y en negrita indican los residuos tipificados más altos por variable y por conglomerado. 234 Tabla de contingencia por calificación NÚMERO INICIAL DE CASOS 1 Recuento 2 2.342 37.044 3 4 5 15.379 2.625 31.022 6 7 8 55.546 24.653 3.907 TOTAL 172.518 A Residuos tipificados 1,6 -3,2 -2,2 1,3 3,3 ,4 -1,1 4,1 Recuento 124 2.713 1.192 128 2.134 3.938 1.837 126 Residuos tipificados -2,9 1,0 2,6 -3,9 -,4 ,3 2,0 -8,2 Recuento 33 930 447 50 622 1.296 605 31 Residuos tipificados -2,7 1,8 4,3 -1,2 -3,2 ,2 1,1 -5,9 Recuento 25 1.125 409 47 250 1.042 542 25 Residuos tipificados -3,0 13,4 5,3 -,6 -14,6 -2,2 1,9 -5,7 Recuento 18 427 133 18 117 383 209 16 Residuos tipificados ,2 8,2 1,2 -,4 -7,6 -2,0 1,4 -2,3 62.205 27.846 4.105 12.192 B 4.014 CALIFICACIÓN C 3.465 D 1.321 E Recuento TOTAL 2.542 42.239 17.560 2.868 34.145 193.510 Fuente: PASW 18.0. De lo anterior se puede concluir que las calificaciones más relevantes que presentan cada uno de los conglomerados son: • Conglomerado 1: Calificación más frecuente: A. • Conglomerado 2: Calificación más frecuente: D y E. • Conglomerado 3: Calificación más frecuente: C y D. • Conglomerado 4: Calificación más frecuente: A. • Conglomerado 5: Calificación más frecuente: A. 235 × • Conglomerado 6: Calificación más frecuente: no presenta un parámetro relevante. • Conglomerado 7: Calificación más frecuente: B. • Conglomerado 8: Calificación más frecuente: A. CON EL MCC Fuente: PASW 18.0 Lo anterior implica que la prueba fue significativa al nivel 5%. La tabla de contingencia entre los MCC y los ocho conglomerados se presenta a continuación. Los valores sombreados con rojo indican los residuos tipificados más altos por variable, comparados contra el valor 25,02. En los casos en los que los residuos tipificados no alcanzan a ser mayores a este valor, se buscan los valores más altos por cada variable. 236 FRECUENTE MCC 1,1 1 -2,1 0 -1,8 171 6,3 3 -1,2 0 -1,8 6 1,5 0 -,8 2 -,3 875 103,0 3 Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento VETERINARIOS ALMACENES DE EQUIPOS, INSUMOS y SERVICIOS AGROPECUARIOS VÍVEROS Y ALMACENES PARA JARDINERÍA CONTRATISTAS GENERALES - RESIDENCIALES Y COMERCIALES TRANSPORTE DE PASAJEROS, TERRESTRE, FLUVIAL y MARITÍMO SERVICIOS DE MENSAJERÍA, CORREO Y ENCOMIENDAS COMPAÑÍAS DE AVIACION COMPRAS EN INTERNET SERVICIOS DE AMBULANCIA OUTLETS AEROLÍNEAS 237 6 218 -12,6 629 1,4 51 -,8 9 2,9 76 5,8 98 4,8 147 -,5 1.736 1,7 67 2,3 129 2,3 82 99 -7,7 270 -1,1 13 -1,3 2 1,1 28 1,9 32 3,4 63 5,8 888 2,2 33 -1,0 37 1,8 36 1 67,4 635 -1,1 1 -,9 0 -,4 3 -1,9 0 ,1 7 -2,1 96 -1,4 1 -2,7 0 -,2 4 48,7 201 -3,2 744 ,5 37 -,8 7 ,9 50 2,3 60 ,1 81 3,9 1.569 ,3 46 4,1 123 3,0 73 -29,3 272 -35,6 133 -1,9 47 -3,6 2 -2,0 62 -5,8 29 -4,2 95 -7,1 2.225 -1,8 64 -2,4 125 -4,8 47 40,7 95 9,8 938 2,4 40 9,2 33 -2,3 22 -,5 33 -2,3 47 -4,8 996 ,1 36 -,2 68 -,3 40 -41,9 Recuento -9,3 7.082 CLÍNICAS VETERINARIAS Y SERVICIOS -20,1 968 -,7 895 Residuos tipificados 911 106 1.884 170 Recuento SIN NOMBRE 7 Tabla de contingencia por MCC NÚMERO INICIAL DE CASOS 1 2 3 4 5 6 11 41,3 515 -1,5 1 -1,1 0 -1,0 3 -2,3 0 ,4 11 15,4 372 -1,9 1 -3,2 0 -,9 4 78,8 1.631 8 900 4.739 192 53 250 252 454 8.053 248 483 292 13.647 TOTAL 0 -,5 9 -,9 0 -,8 4 -3,2 0 -,7 1 -2,6 13 -5,5 4 Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento SUSCRIPCIÓN T.V POR CABLE Y OTROS SERVICIOS DE RADIO Y TV PAGOS COMPUTADORES - EQUIPOS - ACCESORIOS - SOTFWARE SUSCRIPCIÓN Y VENTA DE PERIÓDICOS Y REVISTAS DÉPOSITO DE MATERIALES DE CONSTRUCCIÓN ALMACENES POR DEPARTAMENTO SIN SUPERMERCADO ALMACENES DE MISCELÁNEAS, SUPERMERCADOS / TIENDAS EXPRESS REGALO / TODO TIPO DE ALMACENES CACHARRERÍA Y ARTÍCULOS PARA FERRETERÍAS ALMACENES DE VIDRIOS Y ESPEJOS 238 -10,9 -7,5 Residuos tipificados TELECOMUNICACIONES Residuos tipificados 8 Recuento VENTA DE EQUIPOS Y SERVICIOS DE 246 23,2 Residuos tipificados Recuento 18 Recuento -5,3 -3,4 Residuos tipificados TURISMO Residuos tipificados 12 Recuento AGENCIAS DE VIAJE Y OPERADORES DE TRANSPORTE DE CARGA EN GENERAL -2,6 Residuos tipificados 18,7 9.772 9,4 821 8,9 1.145 2,6 172 ,3 8 3,0 335 ,5 12 1,7 225 -1,1 2 3,9 1.331 -3,1 0 3,4 591 1,5 9,1 3.889 4,0 309 6,1 484 1,1 67 -1,2 1 2,6 147 -,6 3 ,5 88 -1,3 0 2,2 545 -2,0 0 2,1 244 1,9 -14,7 205 -5,6 5 -7,0 6 -2,8 1 -,7 0 -3,7 3 -,8 0 ,9 17 -,5 0 -8,6 4 1,7 2 -5,7 1 -3,4 11,6 7.474 3,1 546 8,3 933 1,6 131 2,6 12 3,9 289 1,3 12 2,1 190 -,3 3 10,6 1.297 ,1 8 -,5 405 3,3 -31,8 8.434 -6,7 674 -6,9 1.048 -,6 199 -,5 9 -,9 401 -,3 14 -,1 295 -1,4 3 -8,2 1.415 -3,7 0 1,3 792 -1,0 21,4 6.891 -1,9 352 -7,2 408 -1,8 76 -,8 3 -4,8 122 -,3 6 -3,9 88 5,4 12 3,1 874 -1,3 3 -2,3 296 -3,0 -23,2 136 -7,3 2 -9,1 1 -3,7 0 -,8 0 -4,7 3 -1,0 0 -1,9 11 -,7 0 -10,7 1 11,6 12 -4,9 15 -1,9 37.047 2.713 4.038 647 33 1.304 47 923 20 5.475 43 2.356 -1,3 0 -,6 3 -,4 4 -17,8 5 -3,6 1 -3,3 5 -4,3 27 -9,7 0 -,6 201 1,5 28 -13,6 0 -,2 1 -3,8 Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados PANADERÍAS, REPOSTERÍAS, SALONES DE TÉ Y CAFETERÍAS ALMACÉN POR DEPARTAMENTO CON SUPERMERCADO VENTA DE VEHÍCULOS AUTOMOTORES Y MOTOCICLETAS REPUESTOS Y ACCESORIOS AUTOMOTRICES ESTACIONES DE SERVICIO (Venta de gasolina y gas vehicular) VENTA DE BOTES Y ACCESORIOS PARA ACTIVIDADES ACUÁTICAS ALMACENES DE VESTUARIO Y ACCESORIOS PARA TODA LA FAMILIA MUEBLES PARA EL HOGAR Y OFICINA SASTRES, MODISTAS, CLÍNICAS DE ROPA ALMACENES DE CALZADO SERVITECAS Y LLANTAS DULCERÍAS 239 2 Recuento SALSAMENTARIAS Y VENTA DE CARNES 2,0 304 -,7 0 -23,5 2.474 10,0 3.560 2,1 11 -2,5 2.246 3,6 538 1,3 235 1,6 398 7,1 5.951 1,3 74 1,4 9 1,8 99 -,6 107 -,4 0 -3,2 1.513 2,0 1.323 -1,6 0 -,6 966 -1,0 178 ,1 90 ,8 163 -1,1 2.203 1,5 34 -,2 2 1,5 43 -4,3 0 -,2 0 -14,5 31 ,7 214 -,6 0 -10,6 26 -5,4 1 -3,8 0 -3,6 7 -19,2 0 -1,1 2 1,0 1 -2,4 0 ,6 228 -,6 0 -29,5 1.528 -,7 2.402 -1,3 2 10,8 2.388 3,2 435 3,3 217 2,0 332 19,3 5.665 1,5 62 1,1 7 1,9 82 4,8 495 ,4 1 80,7 11.976 -10,8 3.715 ,4 10 -23,2 2.120 -1,4 644 ,2 321 3,3 619 -9,8 7.115 -1,5 79 -,5 7 -2,3 96 -5,4 107 1,3 1 -40,6 535 5,7 2.238 ,1 4 38,1 3.069 ,0 305 -1,8 121 -6,1 148 5,6 3.913 -,9 36 -1,9 0 ,1 55 -4,7 2 -,2 0 -18,4 23 -8,8 142 -,8 0 -14,4 11 -5,5 8 -4,4 1 -3,5 15 -23,0 0 -2,1 1 -,7 0 -2,5 1 1.244 2 18.108 13.795 27 10.853 2.114 986 1.687 24.851 291 26 378 0 Recuento ALMACENES DE COLGADURAS, -,2 1 -1,9 0 -2,7 13 ,8 0 Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento ALMACENES DE ARTÍCULOS PARA EL HOGAR ALMACENES DE ELECTRODOMÉSTICOS Y GASODOMÉSTICOS ALMACENES DE VENTA DE EQUIPOS ELECTRÓNICOS ALMACENES DE MÚSICA - 13 7,0 0 -,9 0 -,3 36 1,8 4 ,9 6 -2,6 Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados ALMACENES DE COMPUTADORES Y SOFTWARE RESTAURANTES, PIZZERÍAS, FUENTES DE SODA VENTA DE COMIDA RÁPIDA BARES, TABERNAS, DISCOTECAS EVENTOS, FIESTAS Y BANQUETES ALMACENES DE DISCOS 240 -,8 PARTITURAS Residuos tipificados INSTRUMENTOS MUSICALES, PIANOS, VENTANAS Residuos tipificados TAPICERÍA Y CUBIERTAS PARA 1,4 Residuos tipificados PISOS 3 Recuento ALMACÉN DE TAPETES, ALFOMBRAS Y -1,8 245 ,0 42 -1,1 421 -1,0 0 -,1 12 -1,1 32 1,6 15 -,1 172 -,9 113 -1,5 77 1,7 2 ,5 25 -,7 107 ,2 18 1,8 209 ,8 1 -,5 4 -1,0 12 -2,0 0 -,3 70 -2,3 35 1,7 48 1,4 1 1,2 13 -4,1 1 ,7 4 -,9 25 -,3 0 -,9 0 7,0 14 -,8 0 -2,0 5 -2,5 1 -2,5 0 -,2 0 -1,2 0 3,8 278 1,1 40 -1,4 333 1,2 2 ,0 10 -1,8 21 ,3 9 -1,6 122 -,2 98 -,7 68 -,7 0 -1,2 13 1,7 439 -,3 59 -,8 636 -,5 1 1,4 24 -2,8 36 1,1 19 3,4 311 7,1 277 4,0 180 -1,0 0 2,1 45 ,0 181 -1,6 19 4,6 373 ,3 1 -,7 6 -2,5 13 -1,4 3 -2,4 89 -4,6 40 -2,2 43 -,7 0 -3,6 1 -5,2 0 ,5 5 -5,7 6 -,3 0 -1,1 0 16,6 36 -1,0 0 -,7 14 -3,5 0 -3,0 0 -,3 0 ,6 3 1257 191 2.039 5 56 177 46 796 564 417 3 103 0 -,6 3 Recuento Residuos tipificados Recuento 0 -,4 19 2,4 3 -3,2 0 -1,3 5 ,2 0 -,7 0 -1,8 1 -2,6 1 -1,9 3 Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento ALMACÉN DE BICICLETAS VENTA Y SERVICIOS ALMACENES DE ARTÍCULOS DEPORTIVOS PAPELERÍAS ( Almacenes de artículos para oficina y colegios) ALMACENES DE RELOJES, JOYAS Y PLATERÍAS ALMACENES DE JUEGOS, JUGUETES Y HOBBIES ALMACENES DE CÁMARAS Y EQUIPOS FOTOGRÁFICOS ALMACENES DE ARTÍCULOS DE CUERO Y MALETAS MERCADEO DIRECTO - SERVICIOS DE ALMACENES DE TELAS LIBRERÍAS 241 -,5 restauración) / PINTURAS / MUSEOS / ARTE Residuos tipificados ANTIGÜEDADES (Ventas, reparación y ALMACENES DE ARTÍCULOS TÍPICOS, CIGARRERÍAS Y LICORERAS -3,5 Residuos tipificados NATURISTAS 16 Recuento DROGUERÍAS, FARMACIAS, TIENDAS 237 1,1 101 ,3 150 1,8 68 -,4 7 1,6 92 -,2 29 2,1 295 2,2 214 ,4 4 ,5 70 1,3 10 5,0 751 154 ,4 40 ,0 61 1,1 28 ,4 4 ,1 33 ,7 15 -2,1 86 -1,4 64 ,5 2 ,1 28 -1,0 1 -1,3 239 0 -2,5 0 -3,2 0 -1,9 0 -,7 0 -1,9 1 -1,4 0 -3,3 4 1,3 17 -,5 0 2,6 10 -,7 0 -4,7 12 335 1,4 85 ,0 118 -2,0 31 ,6 8 -1,1 54 -1,9 15 -1,7 186 -2,4 119 ,8 4 -1,4 43 -1,4 2 -3,5 427 558 ,5 138 3,1 261 3,7 114 ,3 13 1,8 133 2,9 64 7,1 522 3,4 327 -,4 4 2,9 125 ,4 11 2,7 1.003 633 -1,5 48 -2,3 74 -4,2 11 -,1 5 -2,7 32 -1,1 15 -5,9 95 -4,8 68 -,8 1 -3,8 18 ,8 6 -,2 408 0 -3,0 0 -2,4 5 -2,3 0 -,9 0 -,9 5 -1,7 0 -4,6 2 -,9 14 -,6 0 -,9 4 -,8 0 -6,8 8 1.920 413 670 252 37 355 138 1.193 842 15 301 30 2.864 0 -2,3 0 -,2 0 -1,2 8 -,1 0 Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento MERCADEO DIRECTO - COMERCIANTES DE VENTAS TELEFÓNICAS / AMWAY VENTA DE ARTÍCULOS MÉDICOS, ODONTOLÓGICOS, ORTOPÉDICOS PERFUMERÍAS Y TIENDAS DE COSMÉSTICOS DISTRIBUIDORES DE MATERIALES PARA -,3 0 -,4 0 -,3 10 12,4 1 -2,6 0 Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento ALMACENES DE MASCOTAS - ALIMENTOS Y ACCESORIOS PARA MASCOTAS INMOBILIARIAS ASEGURADORAS ENTIDADES FINANCIERAS PRODUCTOS QUÍMICOS 242 0 FLORISTERÍAS Recuento MADERA COMBUSTIBLE, PÉTROLEO LÍQUIDO, COMBUSTIBLE, CARBÓN, ACEITE -,2 -6,8 Residuos tipificados DE VENTAS TELEFÓNICAS / DIRECTV Residuos tipificados 11 Recuento MERCADEO DIRECTO - COMERCIANTES GALERÍAS DE ARTE - MARQUETERÍAS -4,4 Residuos tipificados SEGUROS 1 -3,2 103 -2,1 3 ,9 3 -,4 2 -1,0 0 -,7 0 1,4 155 ,1 25 -,8 0 -1,4 77 -9,7 775 -8,9 0 -2,3 41 -1,5 1 -,9 0 ,9 2 2,3 2 -,4 0 -,6 53 -1,3 6 3,3 2 ,1 38 -3,5 382 -1,5 0 -3,1 0 12,8 11 -,3 0 -,4 0 -,3 0 -,2 0 -,8 7 -1,3 0 -,2 0 -1,7 2 -8,6 0 -5,3 2 -2,3 89 ,8 10 -,3 1 -,8 1 -,9 0 -,6 0 -,9 103 1,4 26 -,7 0 1,7 88 -3,6 781 -,2 4 9,9 349 -3,8 0 ,3 3 1,1 6 ,3 2 1,7 2 2,5 240 1,9 48 ,0 1 1,1 146 1,3 1.667 -2,4 0 -3,4 60 -1,3 3 -,1 1 -,6 1 ,3 1 -,5 0 -2,7 66 -2,0 8 -,7 0 ,3 62 25,6 1.412 21,5 0 -3,7 0 5,2 6 -,4 0 -,5 0 -,3 0 -,2 0 -2,3 5 -1,5 0 -,3 0 -2,6 1 -10,2 1 -6,4 7 643 44 8 12 5 2 637 113 3 414 5.029 12,3 0 -1,1 0 -,2 2 -1,2 0 -,8 0 -,1 0 -1,2 0 -,3 0 -,8 0 -,3 0 -,2 0 -,6 0 Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento SERVICIOS FUNERARIOS Y PARQUES CEMENTERIOS GIMNASIOS, SAUNA, BAÑOS TURCOS y CENTROS DE ESTÉTICA GRILES -WISKERIAS- NIGHT CLUB -STRIP TEASE SERVICIOS DE PUBLICIDAD, MEDIOS Y ARTES GRÁFICAS SERVICIOS DE REPRODUCCCIÓN Y FOTOCOPIAS ADMINISTRACIÓN DE ÁREAS COMUNES, SERV. DE LIMPIEZA, MANT. Y CELADURÍA SERVICIOS Y ASESORIAS PROFESIONALES AGENCIAS DE PROTECCIÓN Y ALQULER DE VESTIDOS Y DISFRACES SALONES DE BELLEZA - PELUQUERÍAS LAVANDERÍAS - LAVASECOS MOTELES y AMOBLADOS 243 103 Recuento HOTELES - CENTROS VACACIONALES -,3 Residuos tipificados 0 -2,0 1 1,7 2 -,3 1 ,5 11 -1,1 0 -,6 22 -,5 0 -1,0 8 -1,1 67 -,7 0 ,2 22 6,5 691 -,4 0 ,4 3 -,5 0 -,7 0 -,5 3 -,7 0 ,8 13 -,3 0 ,5 6 -1,0 26 1,9 1 ,7 11 -2,2 192 -,8 0 -,6 0 -,2 0 -,3 0 -,8 0 -,3 0 -1,3 0 -,1 0 -,9 0 -2,3 0 -,2 0 ,5 2 ,9 42 -,3 0 ,2 5 -,7 0 ,9 2 ,5 9 ,9 2 -,2 19 2,0 1 -,8 7 ,4 65 1,1 1 ,2 18 -,6 425 ,7 3 2,6 16 ,0 1 ,1 2 -1,0 10 ,1 2 2,4 51 -,6 0 3,1 30 1,3 126 -,8 0 ,7 35 -11,0 486 1,2 0 -1,4 1 -,7 0 ,1 1 1,5 10 1,2 2 -1,8 9 -,4 0 -2,0 2 1,9 64 -,5 0 -1,3 9 -2,1 316 -1,0 0 -,7 0 -,3 0 -,4 0 -1,0 0 -,4 0 -1,6 0 -,1 0 -1,1 0 -2,7 0 -,2 0 -1,4 0 23,5 223 -,4 3 26 3 6 43 6 114 1 53 350 2 97 2.478 0 -,8 48 20,5 0 -,3 0 -1,4 0 -,3 0 -,2 5 ,6 0 -,4 0 -2,0 20 ,2 0 -2,0 0 -,5 9 Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento COMPAÑÍAS DE ALQUILER DE VEHÍCULOS TALLERES DE MECÁNICA, LATONERÍA Y PINTURA Y SERVICIOS DE GRÚA ALMACENES DE REPARACIONES ELECTRÓNICAS ALMACENES DE REPARACIÓN DE ARTÍCULOS ELÉCTRICOS AGENCIAS DE BOLETERÍA ( Producciones de teatro ) EXCEPTO CINE CASINOS, JUEGOS DE AZAR, LOTERÍAS Y RIFAS CONSULTORIOS Y SERVICIOS MÉDICOS SERVICIOS DE RECREACIÓN CLUBES SOCIALES Y DEPORTIVOS TIENDAS DE ALQUILER DE VIDEOS SALAS DE CINE GARAJES Y PARQUEADEROS INSUMOS INDUSTRIALES 244 -,2 Residuos tipificados SERVICIOS DE SEGURIDAD 197 -,4 4 -,6 65 -4,1 246 -,6 62 -1,2 1 -,8 57 ,4 1 -,1 1 -,4 31 -1,4 0 -4,9 32 ,0 12 -,8 99 -1,4 0 ,0 29 -1,2 119 -,9 23 -1,1 0 -1,6 18 -,5 0 -,7 0 -1,6 8 -,9 0 -3,6 11 -1,3 2 -,5 3 -,6 0 -2,2 0 -2,3 11 -2,1 0 -,5 0 -1,6 1 -,2 0 -,3 0 -1,5 0 -,4 0 19,5 49 -,9 0 -,2 187 1,1 6 -1,4 46 4,5 332 -3,7 27 2,2 6 2,1 66 ,6 1 ,1 1 ,8 31 ,3 2 -4,2 28 3,0 19 -,7 403 1,9 12 2,6 129 -12,9 192 7,4 172 ,7 6 3,7 129 ,0 1 -,5 1 2,7 68 1,2 5 -9,9 6 ,3 19 2,1 182 -1,8 0 ,2 47 22,4 537 -3,2 23 -,7 1 -4,3 14 -,7 0 1,5 2 -1,5 15 ,6 2 -2,0 35 -1,7 3 -,7 5 -,7 0 -1,4 3 -3,8 10 -2,6 0 -,5 0 -2,5 0 -,3 0 -,3 0 -1,8 0 -,4 0 46,7 133 -1,1 0 -,3 1.085 22 319 1.467 307 14 290 3 5 153 9 342 55 2 -1,4 0 -,4 0 -1,4 19 -,5 0 -1,4 0 -,7 340 59,1 0 -,4 2 -1,7 0 -2,7 Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados Recuento Residuos tipificados COLEGIOS, UNIVERS., INST. DE EDUCACIÓN TECN. Y PREESCOLAR ORGANIZACIONES DE SERVICIO SOCIAL Y DE CARIDAD ASOCIACIONES PROFESIONALES Y GREMIOS TOTAL SERVICIOS PÚBLICOS PAGO DE IMPUESTOS / PAGOS DE TDC CONGRESOS Y SEMINARIOS ESCUELAS DE ENSEÑANZA INFORMAL MEDICINA PREPAGADA LABORATORIOS CLÍNICOS CLÍNICAS - HOSPITALES 42.239 -1,5 101 -3,8 63 -1,8 0 -14,0 162 -1,1 5 -1,4 23 ,7 369 -,6 28 -,2 3 -1,9 67 -1,1 117 -2,6 245 Fuente: PASW 18.0. 2.542 -,6 Residuos tipificados Recuento 6 Recuento ÓPTICAS Y ARTÍCULOS ÓPTICOS -1,4 Residuos tipificados 17.560 -,8 43 -2,0 29 -1,2 0 -6,9 97 -1,9 0 -1,1 9 -3,5 106 1,4 18 -1,2 0 -,4 33 -,5 50 ,1 2.868 -2,8 0 -2,6 0 -,5 0 77,7 467 -,8 0 -1,5 0 -3,3 8 -1,5 0 -,5 0 -2,0 1 -2,6 1 -3,3 34.145 ,6 100 -1,7 66 ,8 4 -10,5 172 ,9 9 1,0 30 -7,4 163 -1,1 20 -1,0 1 -,3 66 -2,5 79 -,3 62.205 2,5 205 4,5 203 2,4 10 -24,2 50 1,1 16 2,3 61 11,9 797 ,4 49 2,4 10 4,8 178 7,1 288 2,9 27.846 1,1 87 4,0 99 -,8 1 -6,7 188 1,1 8 -,3 19 -5,9 144 1,8 29 -,8 1 -2,6 36 -4,4 45 2,1 4.105 -3,4 0 -3,1 0 -,6 0 89,6 646 -,9 0 -1,7 0 -1,6 25 -1,7 0 -,6 0 -1,5 4 -1,6 7 -3,8 193.510 536 462 15 2.122 38 142 1631 144 15 387 593 De lo anterior se puede concluir que por conglomerado los MCC más frecuentes se distribuyen de la siguiente manera: • Conglomerado 1: Establecimientos comerciales más frecuentados: aerolíneas, compras en Internet, transporte de carga en general, almacenes de computadores y software, entidades financieras, hoteles y centros vacacionales, compañías de alquiler de vehículos y asociaciones profesionales y gremios. • Conglomerado 2: Establecimientos comerciales más frecuentados: Contratistas generales, residenciales y comerciales, almacenes por departamento sin supermercado, almacenes de misceláneas, cacharrerías y artículos para regalo, supermercados y tiendas exprés, almacén por departamento con supermercado, almacenes de vestuario y accesorios para toda la familia, droguerías, farmacias, tiendas naturistas, mercadeo directo, servicios de seguros, mercadeo directo, comerciantes de ventas telefónicas – DIRECTV y hoteles y centros vacacionales. • Conglomerado 3: Establecimientos comerciales más frecuentados: aerolíneas, almacenes por departamento sin supermercado y supermercados y tiendas exprés. • Conglomerado 4: Establecimientos comerciales más frecuentados: sin nombre, compras en Internet, almacenes de computadores y software, entidades financieras, compañías de alquiler de vehículos y asociaciones profesionales y gremios. • Conglomerado 5: Establecimientos comerciales más frecuentados: venta de equipos y servicios de telecomunicaciones, almacenes por departamento sin supermercado, supermercados y tiendas exprés, almacén por departamento con supermercado y estaciones de servicio (venta de gasolina y gas vehicular). • Conglomerado 6: Establecimientos comerciales más frecuentados: sin nombre, almacenes de calzado, almacenes de electrodomésticos y gasodomésticos, librerías, aseguradoras, agencias de boletería (producciones de teatro) excepto cine, ópticas y artículos ópticos y colegios, universidades, institutos de educación tecnológica y prescolar. • Conglomerado 7: Establecimientos comerciales más frecuentados: servicios de ambulancia, comprar en Internet, suscripción por cable y otros servicios de radio y T.V. pagos, supermercados y tiendas exprés, almacén por departamento con supermercado, estaciones de servicio (venta de gasolina y gas vehicular), almacenes de vestuario y accesorios para toda la familia, mercadeo directo, servicios de seguros, mercadeo directo, comerciantes de ventas telefónicas – DIRECTV y casinos, juegos de azar, loterías y rifas. • Conglomerado 8: Establecimientos comerciales más frecuentados: sin nombre, aerolíneas, compras en Internet, transporte de carga en general, almacenes de computadores y software, 246 entidades financieras, hoteles y centros vacacionales, compañías de alquiler de vehículos y asociaciones profesionales y gremios. × CON LOS CONGLOMERADOS RAM Fuente: PASW 18.0. Lo anterior implica que la prueba es significativa a un nivel 5%. La tabla de contingencia entre los conglomerados RAM y los ocho conglomerados iniciales se presenta a continuación. Los conglomerados RAM “-“ implican clientes que no cuentan con esta información. Los valores sombreados con rojo indican los residuos tipificados más altos por variable, comparados contra el valor 25,02. En los casos en los que los residuos tipificados no alcanzan a ser mayores a este valor, se buscan los valores más altos por cada variable. - AAA AAB RAM ABA ABB BAA BAB NÚMERO INICIAL DE CASOS 3 4 5 6 7 1 2 Recuento 107 2.103 879 144 1.772 2.977 1.468 218 Residuos tipificados -1,8 -,2 ,1 ,1 1,6 -2,3 2,1 ,9 Recuento 190 2.913 1.249 206 2.053 3.648 2.020 282 Residuos tipificados 1,9 3,3 3,2 1,5 -3,5 -6,1 5,0 1,0 Recuento 192 5.956 2.571 286 3.699 10.245 2.307 454 Residuos tipificados -7,9 4,6 4,9 -4,9 -12,4 21,8 -22,9 -3,9 Recuento 253 6.313 2.671 362 5.665 11.158 2.719 556 Residuos tipificados -6,9 -2,1 -,5 -3,7 5,9 16,5 -23,8 -2,9 Recuento 87 2.872 1.283 123 1.793 6.699 926 260 Residuos tipificados -7,2 -3,5 ,2 -5,9 -13,8 32,5 -24,4 -2,2 Recuento 444 4.197 1.682 367 3.391 3.872 5.303 418 Residuos tipificados 11,5 -1,5 -2,4 4,4 -1,4 -30,8 46,5 ,0 Recuento 478 7.256 2.934 489 4.807 7.928 5.861 714 247 8 TOTAL 9.668 12.561 25.710 29.697 14.043 19.674 30.467 BBA BBB TOTAL Residuos tipificados 3,9 7,4 3,2 1,8 -7,8 -18,9 22,3 2,7 Recuento 644 8.042 3.222 706 8.970 11.098 5.914 861 Residuos tipificados 5,5 -6,1 -6,0 5,0 24,1 -14,1 3,1 ,8 Recuento 147 2.587 1.069 185 1.995 4.580 1.328 342 Residuos tipificados -1,1 -1,6 -1,2 ,3 -3,5 10,3 -10,3 5,1 Recuento 2542 42.239 62.205 27.846 4105 17.560 2.868 34.145 39.457 12.233 193.510 Fuente: PASW 18.0. De lo anterior se puede concluir que por grupo, los conglomerados RAM más frecuentes se distribuyen de la siguiente manera: × • Conglomerado 1: Grupo RAM más frecuente: BAA y BBA. • Conglomerado 2: Grupo RAM más frecuente: BAB. • Conglomerado 3: Grupo RAM más frecuente: no presenta un parámetro relevante. • Conglomerado 4: Grupo RAM más frecuente: BBA. • Conglomerado 5: Grupo RAM más frecuente: ABA y BBA. • Conglomerado 6: Grupo RAM más frecuente: AAB, ABA, ABB, BBB. • Conglomerado 7: Grupo RAM más frecuente: AAA, BAA y BAB. • Conglomerado 8: Grupo RAM más frecuente: BBB. CON LAS EDADES Fuente: PASW 18.0. Lo anterior implica que la prueba es significativa a un nivel 5%. 248 La tabla de contingencia entre las edades y los ocho conglomerados iniciales se presenta a continuación. Los valores sombreados con rojo indican los residuos tipificados más altos por variable, comparados contra el valor 25,02. En los casos en los que los residuos tipificados no alcanzan a ser mayores a este valor, se buscan los valores más altos por cada variable. NÚMERO INICIAL DE CASOS 1 2 3 4 5 6 7 8 Recuento 1 2 0 0 5 3 4 0 Residuos tipificados 1,8 -,7 -1,2 -,5 1,4 -,8 1,3 -,6 Recuento 99 2.493 962 128 2.782 4.490 1.355 113 Residuos tipificados -5,0 -4,2 -4,9 -4,1 12,6 7,9 -10,2 -9,3 Recuento 797 12.422 5.276 936 10.802 19.315 7.473 1.250 Residuos tipificados 1,1 -2,6 -,2 2,5 5,1 4,3 -10,0 ,4 Recuento 1218 21.586 9.042 1.372 16.200 30.453 14.702 2.119 Residuos tipificados -1,5 3,3 2,9 -1,6 -6,6 -3,6 6,7 1,5 Recuento 375 5.086 2.026 366 3.832 7.013 3.759 538 Residuos tipificados 4,2 ,9 -1,3 1,4 -3,5 -4,4 7,8 2,3 Recuento 39 539 212 48 432 783 454 61 Residuos tipificados ,9 -,9 -1,4 1,6 -1,0 -1,5 4,4 ,9 Recuento 13 111 42 18 92 147 99 24 Residuos tipificados 2,2 -,7 -1,1 3,5 -,4 -2,2 2,3 3,6 Recuento 2.542 42.239 17.560 2.868 34.145 62.204 27.846 4.105 TOTAL 15 16-18 19-25 12.422 58.271 26-35 EDAD 96.692 36-55 22.995 56-70 2.568 >70 546 Empr. TOTAL 193.509 Fuente: PASW 18.0. De lo anterior se puede concluir que por grupo las edades más frecuentes se distribuyen de la siguiente manera: • Conglomerado 1: Edad más frecuente: entre 56 y 70 años, • Conglomerado 2: Edad más frecuente: entre 36 y 55. • Conglomerado 3: Edad más frecuente: entre 36 y 55 años. • Conglomerado 4: Edad más frecuente: entre 26 y 35 años. • Conglomerado 5: Edad más frecuente: entre 19 y 25 años y entre 26 y 35 años. • Conglomerado 6: Edad más frecuente: entre 19 y 25 años y entre 26 y 35 años. 249 × • Conglomerado 7: Edad más frecuente: entre 35 y 55 años y entre 56 y 70 años. • Conglomerado 8: Edad más frecuente: entre 26 y 35 años. CON LOS GÉNEROS Fuente: PASW 18.0. Lo anterior implica que la prueba es significativa a un nivel 5%. La tabla de contingencia entre los géneros y los ocho conglomerados iniciales se presenta a continuación. Los valores sombreados con rojo indican los residuos tipificados más altos por variable, comparados contra el valor 25,02. En los casos en los que los residuos tipificados no alcanzan a ser mayores a este valor, se buscan los valores más altos por cada variable. 0 E SEXO F M TOTAL NÚMERO INICIAL DE CASOS 3 4 5 6 1 2 7 8 Recuento 0 0 0 0 0 1 0 0 Residuos tipificados -,1 -,5 -,3 -,1 -,4 1,2 -,4 -,1 Recuento 13 111 42 18 92 147 99 24 Residuos tipificados 2,2 -,7 -1,1 3,5 -,4 -2,2 2,3 3,6 Recuento 1.075 21.580 9.069 1.243 17.369 31.810 14.339 1.683 Residuos tipificados -6,0 1,0 1,7 -5,6 ,4 1,4 1,8 -8,8 Recuento 1.454 20.548 8.449 1.607 16.684 30.246 13.408 2.398 Residuos tipificados 5,9 -1,0 -1,7 5,4 -,3 -1,3 -2,0 8,6 Recuento 2542 42.239 17.560 2.868 34.145 62.204 27.846 4.105 TOTAL 1 546 98.168 94.794 193.509 Fuente: PASW 18.0. De lo anterior se puede concluir que por grupo los géneros más frecuentes se distribuyen de la siguiente manera: 250 × • Conglomerado 1: Género más frecuente: masculino. • Conglomerado 2: Género más frecuente: femenino. • Conglomerado 3: Género más frecuente: femenino. • Conglomerado 4: Este grupo contiene empresas en su mayoría. Con respecto a las personas naturales: Género más frecuente: masculino. • Conglomerado 5: Género más frecuente: no presenta un parámetro relevante. • Conglomerado 6: Género más frecuente: femenino. • Conglomerado 7: Género más frecuente: femenino. • Conglomerado 8: Este grupo contiene empresas en su mayoría. Con respecto a las personas naturales: Género más frecuente: masculino. CON LOS ESTADOS CIVILES Fuente: PASW 18.0. Lo anterior implica que la prueba es significativa a un nivel 5%. La tabla de contingencia entre los estados civiles y los ocho conglomerados iniciales se presenta a continuación. Los valores sombreados con rojo indican los residuos tipificados más altos por variable, comparados contra el valor 25,02. En los casos en los que los residuos tipificados no alcanzan a ser mayores a este valor, se buscan los valores más altos por cada variable. 251 7 8 Recuento 183 3.924 1.569 231 2.741 5.666 2.078 285 información Residuos tipificados -2,4 4,7 1,4 -1,0 -3,7 4,2 -6,6 -3,7 Recuento 901 14.078 5.915 1.018 12.182 21.381 8.886 1.396 Residuos tipificados 1,3 -2,3 -,7 1,4 5,4 1,7 -5,9 ,0 Recuento 1.096 15.733 6.502 1.246 12.229 21.598 11.633 1.852 Residuos tipificados 4,9 ,3 -,3 5,5 -4,0 -9,9 12,7 8,4 Recuento 74 1.401 542 69 1.120 1.952 986 98 Residuos tipificados -,9 1,0 -1,0 -2,4 ,6 -1,2 2,9 -3,0 Recuento 29 602 273 37 530 989 475 48 Residuos tipificados -1,6 -1,9 ,1 -1,1 ,2 1,0 2,2 -1,9 Recuento 57 631 274 58 479 921 490 104 Residuos tipificados 2,8 -1,0 ,0 2,0 -2,3 -1,5 2,7 5,0 Recuento 189 5.756 2.442 190 4.769 9.546 3.197 296 Residuos tipificados -8,5 ,0 1,0 -10,2 1,7 11,6 -9,7 -11,1 Recuento 0 3 1 1 3 4 2 2 Residuos tipificados -,5 -,3 -,4 1,6 ,1 -,5 -,2 2,9 Recuento 13 111 42 18 92 147 99 24 Residuos tipificados 2,2 -,7 -1,1 3,5 -,4 -2,2 2,3 3,6 Recuento 2.542 42.239 17.560 2.868 34.145 62.204 27.846 4.105 Casado Separado CIVIL 2 TOTAL Sin Soltero ESTADO 1 NÚMERO INICIAL DE CASOS 3 4 5 6 Viudo Divorciado Unión libre Religioso Empresas TOTAL Fuente: PASW 18.0. De lo anterior se puede concluir que por grupo los estados civiles más frecuentes se distribuyen de la siguiente manera: • Conglomerado 1: Estado civil más frecuente: casado. • Conglomerado 2: Estado civil más frecuente: no presenta un parámetro relevante. • Conglomerado 3: Estado civil más frecuente: no presenta un parámetro relevante. • Conglomerado 4: Este grupo contiene empresas en su mayoría. Con respecto a las personas naturales: estado civil más frecuente: casado. • Conglomerado 5: Estado civil más frecuente: soltero. • Conglomerado 6: Estado civil más frecuente: unión libre. 252 16.677 65.757 71.889 6.242 2.983 3.014 26.385 16 546 193.509 × • Conglomerado 7: Estado civil más frecuente: casado. • Conglomerado 8: Este grupo contiene empresas en su mayoría. Con respecto a las personas naturales: estado civil más frecuente: casado. CON LAS OCUPACIONES Fuente: PASW 18.0. Lo anterior implica que la prueba es significativa a un nivel 5%. La tabla de contingencia entre las ocupaciones y los ocho conglomerados iniciales se presenta a continuación. Los valores sombreados con rojo indican los residuos tipificados más altos por variable, comparados contra el valor 25,02. En los casos en los que los residuos tipificados no alcanzan a ser mayores a este valor, se buscan los valores más altos por cada variable. NÚMERO INICIAL DE CASOS 3 4 5 6 1 2 Recuento 26 357 140 18 279 Residuos tipificados ,8 -,6 -1,0 -1,4 Servidor Recuento 5 34 8 público Residuos tipificados 2,4 ,7 Recuento 1.278 Residuos tipificados Ama de casa Empleado OCUPACIÓN Independiente Pensionado Religioso Socio 7 8 547 286 31 -1,1 ,2 2,8 -,8 2 18 49 19 2 -1,3 ,0 -1,3 ,7 -,2 -,5 27.628 11.597 1.737 22.052 41.716 16.991 2.332 -9,1 1,6 2,1 -2,8 -,4 7,1 -7,8 -6,3 Recuento 1.007 10.576 4.348 861 9.150 14.723 8.277 1.388 Residuos tipificados 13,5 -3,9 -3,2 4,2 2,9 -11,4 12,2 9,8 Recuento 67 1.154 488 62 907 1.658 880 98 Residuos tipificados -,3 -,2 ,3 -1,9 -1,0 -1,2 4,2 -1,4 Recuento 0 2 0 0 0 2 1 0 Residuos tipificados -,3 ,9 -,7 -,3 -,9 ,3 ,3 -,3 Recuento 11 86 35 6 67 104 90 23 Residuos tipificados 2,3 -,6 -,5 -,1 -,9 -2,7 3,8 4,7 253 TOTAL 1.684 137 125.331 50.330 5.314 5 422 Empr. y sin Recuento 110 2.118 815 137 1.434 3.025 1.145 178 información Residuos tipificados -,7 3,7 ,1 ,4 -3,7 2,7 -4,0 -,9 Recuento 38 284 129 45 238 380 157 53 Residuos tipificados 4,9 -,3 ,8 5,7 ,3 -2,2 -2,4 4,7 Recuento 2.542 42.239 17.560 2.868 34.145 62.204 27.846 4.105 Estudiante TOTAL 8.962 1.324 193.509 Fuente: PASW 18.0. De lo anterior se puede concluir que por grupo las ocupaciones más frecuentes se distribuyen de la siguiente manera: • Conglomerado 1: Ocupación más frecuente: independiente. • Conglomerado 2: Ocupación más frecuente: no presenta un parámetro relevante. • Conglomerado 3: Ocupación más frecuente: no presenta un parámetro relevante. • Conglomerado 4: Este grupo contiene empresas en su mayoría. Con respecto a las personas naturales: ocupación más frecuente: estudiante. • Conglomerado 5: Ocupación más frecuente: independiente. • Conglomerado 6: Ocupación más frecuente: empleado. • Conglomerado 7: Ocupación más frecuente: independiente. • Conglomerado 8: Este grupo contiene empresas en su mayoría. Con respecto a las personas naturales: ocupación más frecuente: independiente. 254