1 MODELO DE MINERÍA DE DATOS COMO HERRAMIENTA

Anuncio
MODELO DE MINERÍA DE DATOS COMO HERRAMIENTA EFICIENTE PARA REALIZAR
AUTORIZACIONES TRANSACCIONALES A LOS TARJETAHABIENTES DEL BANCO DAVIVIENDA S.A.
PAOLA BELTRÁN HERRERA
PONTIFICIA UNIVERSIDAD JAVERIANA
FACULTAD DE INGENIERÍA
CARRERA DE INGENIERÍA INDUSTRIAL
BOGOTÁ, D.C.
2011
1
MODELO DE MINERÍA DE DATOS COMO HERRAMIENTA EFICIENTE PARA REALIZAR
AUTORIZACIONES TRANSACCIONALES A LOS TARJETAHABIENTES DEL BANCO DAVIVIENDA S.A.
PAOLA BELTRÁN HERRERA
Trabajo de grado en el énfasis de Métodos Cuantitativos
para optar al título de Ingeniera Industrial
DIRECTOR
JORGE ANDRÉS ALVARADO VALENCIA
INGENIERO INDUSTRIAL
PONTIFICIA UNIVERSIDAD JAVERIANA
FACULTAD DE INGENIERÍA
CARRERA DE INGENIERÍA INDUSTRIAL
BOGOTÁ, D.C.
2011
2
TABLA DE CONTENIDO
RESUMEN EJECUTIVO ......................................................................................................................... 8
1.
2.
ANTECEDENTES........................................................................................................................... 9
1.1.
SECTOR FINANCIERO EN COLOMBIA ................................................................................... 9
1.2.
EL NEGOCIO DE LAS TARJETAS DE CRÉDITO.................................................................... 10
1.3.
BANCO DAVIVIENDA S.A. .................................................................................................... 11
1.4.
EL BANCO DAVIVIENDA S.A. Y EL SECTOR DE LAS TARJETAS DE CRÉDITO ..................... 13
1.5.
TARJETAS DE CRÉDITO DENTRO DEL BANCO DAVIVIENDA S.A. ....................................... 15
1.6.
FORMULACIÓN Y PLANTEAMIENTO DEL PROBLEMA ......................................................... 18
SITUACIÓN ACTUAL DEL PROCESO DE VALORACIÓN Y OTORGAMIENTO DE EXTRA CUPOS EN
EL BANCO DAVIVIENDA S.A. ....................................................................................................... 20
3.
2.1.
DEPARTAMENTO DE ANÁLISIS DE RIESGO DE CRÉDITO DEL BANCO DAVIVIENDA S.A. ... 20
2.2.
DEPARTAMENTO DE MONITOREO DE MEDIOS DE PAGO DEL BANCO DAVIVIENDA S.A. ... 21
2.3.
UNIDAD DE INTELIGENCIA DE NEGOCIOS DE LA VICEPRESIDENCIA DE MEDIOS DE PAGO
DEL BANCO DAVIVIENDA S.A. ............................................................................................ 21
2.4.
DESCRIPCIÓN DEL PROCESO ACTUAL .............................................................................. 22
2.4.1.
Transacción a través de POS (nivel nacional).................................................................. 22
2.4.2.
Transacción a través de ATM (nivel nacional).................................................................. 24
2.4.3.
Transacción a través de ATM/POS (nivel internacional) ................................................... 24
2.5.
POLÍTICAS Y GENERALIDADES DEL PROCESO ................................................................ 25
2.6.
DIAGRAMAS DE PROCESO ................................................................................................. 27
2.6.1.
Proceso de valoración y otorgamiento de extra cupos a través de POS a nivel nacional...... 28
2.6.2.
Proceso de valoración y otorgamiento de extra cupos a través de ATM (propios y de otras
redes) y canales propios a nivel nacional ....................................................................... 31
2.6.3.
Proceso de valoración y otorgamiento de extra cupos a través de ATM de otras redes a nivel
nacional ...................................................................................................................... 35
SISTEMA DE INFORMACIÓN RELACIONADO CON EL PROCESO DE VALORACIÓN Y
OTORGAMIENTO DE EXTRA CUPOS EN EL BANCO DAVIVIENDA S.A. ........................................ 38
3.1.
DESCRIPCIÓN DEL SISTEMA DE INFORMACIÓN ................................................................ 38
3.2.
ESTRUCTURA DEL SISTEMA DE INFORMACIÓN................................................................. 39
3.3.
PROCESO DE GENERACIÓN DE DATOS ............................................................................. 41
3.4.
DIAGRAMAS DE PROCESO ................................................................................................. 43
3
4.
3.4.1.
Diagrama de flujo del proceso de generación de datos relevantes para la elaboración de
informes y toma de decisiones ...................................................................................... 44
3.4.2.
Diagrama de contexto del Sistema de Información para la generación de información dentro
del Banco Davivienda S.A............................................................................................. 45
3.4.3.
Diagrama de Nivel 0..................................................................................................... 46
DICCIONARIO DE DATOS ............................................................................................................ 48
4.1.
GENERALIDADES ............................................................................................................... 48
4.2.
METODOLOGÍA ................................................................................................................... 49
4.3.
VARIABLES INICIALES ........................................................................................................ 55
4.4.
VARIABLES SELECCIONADAS ............................................................................................ 60
4.4.1.
5.
MECANISMO DE MINERÍA DE DATOS ......................................................................................... 64
5.1.
SELECCIÓN DEL MÉTODO A EMPLEAR .............................................................................. 64
5.2.
DESCRIPCIÓN DEL MÉTODO .............................................................................................. 65
5.3.
DESARROLLO DEL MODELO .............................................................................................. 67
5.3.1.
6.
7.
Criterios para la selección de variables ........................................................................... 62
Definición de parámetros ............................................................................................... 67
5.4.
CARACTERIZACIÓN DE LOS CLIENTES .............................................................................. 69
5.5.
POLÍTICAS PROPUESTAS ................................................................................................... 81
PROPUESTA FINAL ..................................................................................................................... 84
6.1.
DESCRIPCIÓN GENERAL .................................................................................................... 84
6.2.
METODOLOGÍA PROPUESTA .............................................................................................. 84
6.3.
OBJETIVO FINAL ................................................................................................................. 84
6.4.
ASPECTOS IMPORTANTES ................................................................................................. 85
6.5.
PROCESO INVOLUCRADO .................................................................................................. 85
6.5.1.
Insumos de la propuesta ................................................................................................ 85
6.5.2.
Procesos de la propuesta............................................................................................... 86
EVALUACIÓN DE LA PROPUESTA............................................................................................... 88
7.1.
ANÁLISIS CUALITATIVO ...................................................................................................... 88
7.2.
ANÁLISIS CUANTITATIVO ................................................................................................... 89
CONCLUSIONES ................................................................................................................................. 94
GLOSARIO DE TÉRMINOS .................................................................................................................. 96
BIBLIOGRAFÍA .................................................................................................................................. 101
A N E X O S ....................................................................................................................................... 105
4
LISTADO DE GRÁFICOS
Gráfico 1. Actores del negocio de tarjetas de crédito. .............................................................................. 11
Gráfico 2. Porcentajes de participación del Banco Davivienda S.A. con respecto a otras 50 entidades
financieras. .......................................................................................................................................... 13
Gráfico 3. Número total de tarjetas de crédito por entidad financiera. ........................................................ 14
Gráfico 4. Distribución de las franquicias de las tarjetas de crédito dentro del Banco Davivienda S.A. ......... 14
Gráfico 5. Situación actual de las tarjetas de crédito dentro del Banco Davivienda S.A. Datos acumulados
(enero 2011 – junio 2011). ..................................................................................................................... 17
Gráfico 6. Total de declinaciones presentadas en tarjeta de crédito. Junio de 2011.................................... 18
Gráfico 7. Proceso de autorización de transacciones por fondos insuficientes a través de tarjeta de crédito. 19
Gráfico 8. Relación entre los departamentos del Banco Davivienda S.A. Producto tarjeta de crédito. .......... 22
Gráfico 9. Objetivos del almacén de datos del Banco Davivienda S.A. ...................................................... 39
Gráfico 10. Estructura del almacén de datos del Banco Davivienda S.A. ................................................... 40
Gráfico 11. Niveles del almacén de datos del Banco Davivienda S.A. ....................................................... 41
Gráfico 12. Proceso de obtención de datos a través del almacén de datos del Banco Davivienda S.A. ........ 43
Gráfico 13. Muestra de datos extraídos del Almacén de Datos. ............................................................... 48
Gráfico 14. Proceso para la selección de variables iniciales. .................................................................... 60
Gráfico 15. Proceso de análisis de conglomerados. ................................................................................ 66
Gráfico 16. Número de clientes por conglomerado. ................................................................................. 71
Gráfico 17. Número de clientes por conglomerado RAM. ......................................................................... 74
Gráfico 18. Proceso de valoración y otorgamiento de extra cupos propuesto. ............................................ 87
5
LISTADO DE TABLAS
Tabla 1. Segmentación de las tarjetas de crédito otorgadas por el Banco Davivienda S.A........................... 16
Tabla 2. Segmentación de las tarjetas de crédito otorgadas a través de la modalidad de marcas compartidas.
........................................................................................................................................................... 17
Tabla 3. Ponderación aproximada de los porcentajes de extra cupos otorgados por el Banco Davivienda S.A.
a través de las franquicias Visa y MasterCard, 2010. ............................................................................... 26
Tabla 4. Número y valor de las transacciones consultadas en ACIERTA a través de las franquicias Visa y
MasterCard, 2010. ................................................................................................................................ 27
Tabla 5. Diccionario de datos de la base inicial de transacciones declinadas por fondos insuficientes .......... 51
Tabla 6. Diccionario de datos de la base inicial de tarjetas de crédito vigentes a julio de 2011..................... 52
Tabla 7. Diccionario de datos de la base demográfica del cliente. ............................................................. 53
Tabla 8. Diccionario de datos de la base agrupada por cliente. ................................................................. 57
Tabla 9. Diccionario de datos de la base agrupada por MCC. ................................................................... 59
Tabla 10. Diccionario de datos de la base agrupada por tarjeta de crédito. ................................................ 59
Tabla 11. Número y porcentaje de casos por conglomerado RAM. ........................................................... 74
Tabla 12. Denominación de los conglomerados. ..................................................................................... 76
Tabla 13. Descripción de las características de los conglomerados. .......................................................... 80
Tabla 14. Políticas por conglomerado..................................................................................................... 83
Tabla 15. Gastos por servicios de ACIERTA 2010. .................................................................................. 89
Tabla 16. Salario anual con factor prestacional por cargo......................................................................... 90
Tabla 17. Salario anual por cargos, incluidos los beneficios del Banco Davivienda S.A. .............................. 91
Tabla 18. Comparación entre la situación actual y los escenarios propuestos ............................................ 93
6
LISTADO DE ANEXOS
ANEXO A. Las 50 Entidades Financieras de Colombia. Tomado de Revista Semana, Edición 1513, páginas
274 y 275. .......................................................................................................................................... 106
ANEXO B. Informe Tarjetas de Crédito. Superintendencia Financiera de Colombia. Mayo 2011. ............... 109
ANEXO C. Variables disponibles en el almacén de datos del Banco Davivienda S.A. ............................... 114
ANEXO D. Descripción de los MCC codificados. ................................................................................... 118
ANEXO E. Análisis previo de los datos. ................................................................................................ 122
ANEXO F. Transformación de las variables. ......................................................................................... 163
ANEXO G. Análisis Factorial................................................................................................................ 173
ANEXO H. Análisis de varianza con un sólo factor (análisis de 2)......................................................... 184
ANEXO I. Análisis de Conglomerados de K medias. .............................................................................. 232
7
RESUMEN EJECUTIVO
Dado el desarrollo de las tecnologías disponibles, tanto de hardware como de software, y las grandes
cantidades de información que se generan a través de estas, la mayoría de las organizaciones cuentan
actualmente con una gran cantidad de datos disponibles, relacionados con el desarrollo de las diferentes
actividades dentro de la empresa. La información que se puede encontrar al interior de las bases de datos es
muy variada, y depende directamente de la razón de ser del negocio y la disponibilidad de herramientas para
la recolección de los datos relacionados. De esta forma, la información con la que cuenta una empresa puede
ir desde los datos básicos de los clientes, los empleados, los procesos, hasta información detallada de las
operaciones de la empresa, las compras, las ventas, y transacciones en tiempo real que impliquen bases de
datos totalmente dinámicas.
La Minería de Datos y la generación de conocimiento a partir de la información disponible (KDD, por sus
siglas en inglés, Knowledge Discovery in Databases) son dos herramientas básicas que se han desarrollado
para abordar las grandes cantidades de información con las que cuentan las empresas. En muchos casos las
organizaciones saben que cuentan con una gran cantidad de información, más sin embargo no saben cómo
aprovecharla, de ahí que el objetivo general de la Minería de Datos sea extraer conocimiento valioso que
permita posteriormente la generación de herramientas que soporten la toma de decisiones estratégicas, para
mejorar los diferentes procesos dentro de las organizaciones (Kubski, 2004).
En el caso específico del Banco Davivienda S.A. se identificó que el proceso relacionado con la valoración y
otorgamiento de autorizaciones transaccionales ocasionales o extra cupos, presentaba una oportunidad de
mejora, ya que se deseaba disminuir la cantidad de transacciones declinadas a sus tarjetahabientes, y a su
vez, dadas las declinaciones, disminuir el número de consultas realizadas a agentes externos a la
organización para la autorización de estas transacciones. La propuesta estuvo encaminada a conocer la
información relacionada con la autorización de extra cupos con la que cuenta el Banco Davivienda S.A.
actualmente; y a partir de esta, generar un mecanismo de Minería de Datos que permita a la entidad
otorgarlos eficientemente a sus tarjetahabientes, disminuyendo el número de transacciones declinadas.
El procedimiento metodológico que se llevó a cabo para el desarrollo del presente trabajo de grado, comenzó
con: (i) la formalización del contexto real de las tarjetas de crédito y el Banco Davivienda S.A. en el país;
seguido por (ii) la revisión, puesta en contexto y documentación del proceso actual de valoración y
otorgamiento de extra cupos y el sistema de información relacionado con éste; luego (iii) el análisis de la
información involucrada con el proceso; y finalmente, (iv) la formalización del modelo de Minería de Datos,
junto con un evaluación de la propuesta, con el fin de determinar el costo – beneficio que conlleva su
implementación dentro de la organización. Finalmente se pudo concluir que a través del análisis de
conglomerados de K medias, se tuvo la posibilidad de generar políticas y estrategias de mercado
personalizadas para cada uno de los grupos clientes.
Cabe destacar que para el mejor entendimiento del presente documento existe un glosario de términos, en la
parte final del mismo, para aquellos términos bancarios que no resulten claros al lector.
8
1. ANTECEDENTES
A continuación se presenta el contexto en el que se desarrolla el presente trabajo de grado.
1.1.
SECTOR FINANCIERO EN COLOMBIA
Unos de los agentes más importantes del Sector Financiero en Colombia, y tal vez de los que más impulsan
el crecimiento del sector, son los Establecimientos de Crédito. Dentro de éstos se encuentran comprendidos
los Establecimientos Bancarios, las Corporaciones Financieras, las Compañías de Financiamiento Comercial,
las Entidades Cooperativas de Carácter Financiero, los Organismos Cooperativos de Grado Superior y las
Instituciones Oficiales Especiales –IOE o Banca de Segundo Piso (SUPERINTENDENCIA FINANCIERA DE
COLOMBIA, 2011).
La ley 45 de 1923 define a los Establecimientos Bancarios como: “todo individuo, corporación, sociedad, o
establecimiento que hace habitualmente el negocio de recibir fondos en depósito general, o de hacer anticipos
en forma de préstamos, o de efectuar descuentos, o cualesquiera de estas operaciones”. Actualmente en
Colombia existen 23 establecimientos bancarios principales, dentro de los cuales se encuentran: Banco de
Bogotá, Banco Popular S.A., Banco Santander S.A., Bancolombia S.A., Scotiabank Colombia S.A., Citibank –
Colombia, HSBC Colombia S.A., Banco GNB Sudameris S.A., Banco Bilbao Vizcaya Argentina Colombia S.A
(BBVA Colombia), Helm Bank S.A., Banco de Occidente, BCSC S.A, Banco Colpatria Multibanca Colpatria
S.A., Banco Agrario de Colombia S.A., Banco Comercial AV Villas S.A., Banco ProCredit Colombia S.A.,
Banco de las Micro finanzas – Bancamia S.A., Banco WWB S.A., Banco Coomeva S.A., Banco Finandina
S.A., Banco Falabella S.A., Banco Pichincha S.A. y el Banco Davivienda S.A. La constitución de estas
entidades financieras en el país permite afirmar que la banca colombiana está controlada en su mayoría por
instituciones de capital nacional, dejando alrededor de un 21% a la intervención de la banca extranjera
(REVISTA SEMANA, 2011).
El sector financiero en los últimos años ha venido tomando una gran importancia dentro de la población
colombiana. Su desarrollo y penetración en el mercado se han dado principalmente por el adelanto de
estrategias, por parte de las entidades bancarias y los diferentes establecimientos de crédito, para aumentar
los portafolios de productos, haciéndolos de fácil acceso y ajustándolos a las necesidades de los diferentes
clientes, de acuerdo con su nivel de ingresos (Cuellar, 2008). Según el artículo de la revista Dinero.com, La
bancarización en Colombia llegó al 62%, en el país, la bancarización ha crecido en los últimos cinco años,
demostrando que actualmente seis de cada diez personas mayores de 18 años, tienen al menos un producto
financiero, pasando el indicador de bancarización del 51 por ciento en 2006 al 62 por ciento en 2011.
El mercado de tarjetas de crédito es un claro ejemplo de este proceso de bancarización. De acuerdo con lo
expuesto por María Mercedes Cuellar en su artículo Avances y obstáculos de la bancarización en Colombia,
9
los créditos de consumo y específicamente las tarjetas de crédito, son los productos con más fácil acceso y
mayor cobertura en Colombia. Esto lo reafirma el informe de inclusión financiera 2006 – 2010 de la
Asobancaria, donde se muestra que el 17 por ciento de la población adulta colombiana cuenta con al menos
una tarjeta de crédito (Dinero.com, 2011).
1.2.
EL NEGOCIO DE LAS TARJETAS DE CRÉDITO
En el negocio de las tarjetas de crédito se involucran tres actores principales: por un lado se encuentran los
tarjetahabientes, por otro lado los comerciantes y, finalmente, el enlace entre los dos anteriores: la plataforma.
La interacción entre estos tres agentes permite que se lleven a cabo las transacciones comerciales, siendo los
tarjetahabientes y los comerciantes los que actúan como demandantes del mercado, y la plataforma, como el
oferente. Lo anterior implica que la plataforma es la encargada de vender el servicio de intermediación entre
los demandantes (también es conocida como red). A este modelo de mercado, por la forma en que está
constituida la relación entre sus agentes interventores, se le conoce como mercado de dos lados o de dos
puntas (Arbeláez & Nieto, 2006).
En este tipo de mercado los compradores y los comerciantes se complementan mutuamente (reciben
beneficios en conjunto); ya que, el hecho de que existan tarjetahabientes que desean realizar transacciones
comerciales, implica que los comercios deseen hacer parte de la red de medios de pago a través de tarjetas
de crédito. Así mismo, sí existen comercios que estén dispuestos a recibir pagos con tarjeta de crédito, se
propiciará que más consumidores deseen adquirir su tarjeta de crédito. Igualmente, sí estas condiciones no
se presentan, no se hará necesaria la colocación de tarjetas de crédito, ni de redes de medios de pago en los
comercios.
El mercado de las tarjetas de crédito ha ido evolucionando a medida que las tecnologías de la información y
los comercios se han ido constituyendo, desarrollando e incrementando (Peña Ayala, 2006). Actualmente,
dentro del mercado de las tarjetas de crédito se ofrecen diferentes servicios y beneficios adicionales a los
tarjetahabientes, lo que permite que el crecimiento de éste aumente considerablemente y cada vez se
abarquen más segmentos de clientes. Dentro de la gran variedad de servicios que se ofrecen a los
consumidores se encuentran: premios, programas de millas, avances en efectivo, seguros de viaje, seguros
de automóviles, asistencia médica, asistencia en el hogar, entre otros.
Las tarjetas de crédito ofrecen dos tipos de servicios: pagos a cuotas y pagos a cargo. Cuando se habla de
pagos a cuotas, se hace referencia a la transacción de compra/pago que ha sido diferida a varios plazos;
mientras que cuando se habla de pagos a cargo, se hace referencia a la transacción de compra/pago que se
cobrará en su totalidad en el siguiente mes. Lo anterior implica que los tarjetahabientes deben asumir un
cargo fijo mensual y el pago de intereses sí difieren sus pagos en el tiempo. Así mismo, los comerciantes
deben cancelar una tarifa, que puede ser fija o variable, de acuerdo con el monto de la transacción realizada,
y la plataforma debe asumir los costos asociados a la instalación de sus redes en los comercios.
10
En general, los tres actores de este tipo de mercado cumplen funciones específicas y conjuntas que permiten
que el negocio de la tarjeta de crédito funcione adecuadamente. En la puesta en marcha del mercado de
tarjeta de crédito, las partes involucradas asumen costos de acuerdo con su participación. El gráfico 1,
presentado a continuación, ilustra la relación entre los diferentes actores del mercado.
Gráfico 1. Actores del negocio de tarjetas de crédito.
Fuente: La autora
De lo anterior, es importante aclarar que el banco emisor es el encargado de la línea de negocio de tarjeta de
crédito y, por lo tanto, es el banco que hace las colocaciones de tarjeta de crédito a sus clientes. Así mismo,
el banco adquirente es el encargado de manejar las cuentas de las transacciones que se realicen en el
comercio (cuentas de las tarjetas de crédito de otros bancos), para lo que pacta con los demás bancos el
manejo de determinado comercio, cobrando un valor adicional a cada uno de ellos.
1.3.
BANCO DAVIVIENDA S.A.
El Banco Davivienda S.A., es una de las empresas que pertenecen al Grupo Empresarial Bolívar. Lleva 39
años participando en el sector financiero colombiano. Se constituyó en agosto de 1972 bajo el nombre de
Coldeahorro, Corporación de Ahorro y Vivienda, y durante su trayectoria ha tenido diferentes cambios, a
través de los cuales ha ido mejorando su servicio, aumentando el cubrimiento de clientes (a nivel nacional e
internacional) y ampliando su portafolio de productos. En los últimos años se ha constituido como el tercer
banco más importante de Colombia (DAVIVIENDA S.A., 2010).
El Banco Davivienda S.A., dentro de sus políticas de mercado, tiene dos enfoques importantes de acuerdo
con segmentos significativos de la economía del país. En primera medida, tiene un enfoque hacia la banca
personal; es decir, ofrece productos a personas naturales, orientados a suplir sus necesidades financieras.
11
Por otro lado está la banca empresarial, la cual se refiere a las diferentes personas jurídicas que adquieren
algún producto del portafolio ofrecido por el Banco Davivienda S.A., exclusivamente con fines empresariales.
Durante la trayectoria del Banco Davivienda S.A. este ha mantenido, en su mayoría, una política enfocada a
la banca personal, en la que ha dirigido su portafolio de productos a la promoción del ahorro y la financiación
de vivienda. Sin embargo, en los últimos años, con la fusión de Granbanco S.A. – Bancafé y Davivienda, se
ha incursionado en el mercado de la banca empresarial, ampliando las líneas de negocio a un segmento
corporativo, oficial y empresarial.
Dentro de la banca personal, con la fusión del Banco Superior a finales del 2004, el Banco Davivienda S.A.
adquirió los productos y servicios especializados de tarjeta de crédito de éste, particularmente, la franquicia
de la tarjeta de crédito Diners. Esta adquisición le permite al Banco Davivienda S.A. ofrecer a sus clientes un
mejor servicio dentro de los créditos de consumo, lo que se evidencia en un portafolio de servicios mucho
más completo (DAVIVIENDA S.A.).
Según lo expuesto por la Revista Semana en su edición especial de Las 100 Empresas más grandes de
Colombia (…y las 900 siguientes), el Banco Davivienda S.A. está posicionado como el segundo banco más
importante de Colombia, comparado contra otras 50 entidades financieras en términos de Ingresos por
Intereses en el 2010, con una participación total del 12%; como el cuarto banco más grande de Colombia en
términos de Utilidades Netas en 2010, con una participación total del 8%; como el tercer banco en términos de
Nivel de Activos en 2010, con una participación total del 10%; como el tercer banco en Cartera de créditos y
operaciones de leasing, con un porcentaje de participación del 11%; ocupa el quinto puesto en Inversiones en
2010, con un porcentaje de participación del 6%; y finalmente, está posicionado como el tercer banco
colombiano con respecto al Patrimonio, con una participación del 8% en 20101.
El gráfico 2, presentado a continuación, resume lo expuesto anteriormente.
1
La información referente a las 50 entidades financieras de Colombia, publicada por la Revista Semana, en su edición
especial del 2 de mayo de 2011, se encuentra en el Anexo A del presente documento.
12
Gráfico 2. Porcentajes de participación del Banco Davivienda S.A. con respecto a otras 50 entidades
financieras.
Fuente: (REVISTA SEMANA, 2011)
De acuerdo con lo anterior es válido afirmar que el Banco Davivienda S.A. está consolidado como uno de los
tres bancos más importantes del país. Esto lo ha ido logrando con la constitución de nuevas alternativas de
negocio, enfocadas a dar cobertura a una gran variedad de clientes. Así mismo, su cultura empresarial
dinámica y vanguardista, y el trabajo en equipo con las demás empresas que constituyen el Grupo
Empresarial Bolívar.
1.4.
EL BANCO DAVIVIENDA S.A. Y EL SECTOR DE LAS TARJETAS DE CRÉDITO
De acuerdo con el informe emitido por la Superintendencia Financiera de Colombia acerca de las tarjetas
débito y crédito para el período de mayo de 2011, se puede evidenciar que el Banco Davivienda S.A.
actualmente es el establecimiento de crédito líder en emisión de tarjetas de crédito en el mercado colombiano.
Cuenta con una participación del 20% del total de tarjetas de crédito disponibles en el mercado, que están
representadas en sus franquicias Visa, MasterCard y Diners. Las principales entidades financieras en emisión
de tarjetas de crédito son: Red Multibanca Colpatria, Tuya S.A., Bancolombia, CMR Falabella y el Banco
Davivienda S.A., siendo este último el líder, en términos de número de tarjetas de crédito vigentes a la fecha
de corte, vigentes en el mes, canceladas y bloqueadas temporalmente. El gráfico 3 resume esta información.
13
Gráfico 3. Número total de tarjetas de crédito por entidad financiera.
Fuente: (SUPERINTENDENCIA FINANCIERA DE COLOMBIA, 2011)
Por otro lado, el gráfico 4 representa la distribución del número de tarjetas de crédito por cada una de las
franquicias del Banco Davivienda S.A.2
Gráfico 4. Distribución de las franquicias de las tarjetas de crédito dentro del Banco Davivienda S.A.
Fuente: (SUPERINTENDENCIA FINANCIERA DE COLOMBIA, 2011)
En general, se puede concluir que el Banco Davivienda S.A. es uno de los principales bancos de Colombia.
Tiene la mayor participación del mercado en su producto de tarjetas de crédito, lo que lo constituye como un
banco con grandes posibilidades en el sector de los créditos de consumo. Así mismo, el mercado de las
La información relacionada con el Banco Davivienda S.A. dentro del sector financiero, específicamente en el producto
de tarjeta de crédito se presenta en el Anexo B del presente documento.
2
14
tarjetas de crédito es bastante interesante para las diferentes entidades financieras, ya que es muy amplio y
asocia unas rentabilidades considerablemente atractivas. De aquí que se haga necesario que el Banco
Davivienda S.A. concentre sus esfuerzos en estudiar la posibilidad de generar alternativas de mejora en el
proceso interno de este producto.
1.5.
TARJETAS DE CRÉDITO DENTRO DEL BANCO DAVIVIENDA S.A.
Dentro del gran portafolio de productos que ofrece el Banco Davivienda S.A. a sus clientes, se encuentran
dos tipos de crédito: los créditos de consumo y los créditos comerciales. De acuerdo con lo estipulado en la
circular externa 035 de 2005 de la Superintendencia Financiera de Colombia, los créditos de consumo se
definen como: “los créditos otorgados a personas naturales para financiar la adquisición de bienes de
consumo o el pago de servicios para fines no comerciales o empresariales, distintos a los otorgados bajo la
modalidad de microcrédito”, y los créditos comerciales son definidos como: “los créditos otorgados a personas
naturales o jurídicas para desarrollar actividades económicas organizadas”.
De acuerdo con las políticas del Banco Davivienda S.A., actualmente se otorgan tarjetas de crédito tanto a
personas naturales como a personas jurídicas. Esto implica que las tarjetas de crédito hacen parte de los
productos de crédito de consumo y de los productos de crédito comercial. En general, el Banco ofrece a sus
clientes una gran variedad de tarjetas de crédito. Esta emisión está ligada a una segmentación previa del
mercado, en la cual a partir del perfil de ingresos y tipo de cliente se le otorga a cada uno una tarjeta de
crédito específica que satisfaga sus necesidades y cumpla con sus expectativas.
A continuación, en la tabla 1 se muestran las tarjetas de crédito que el Banco Davivienda S.A. otorga a
personas naturales o personas jurídicas, con una breve descripción del segmento del mercado al que van
dirigidas (DAVIVIENDA S.A., 2006).
TARJETA DE CRÉDITO
CARACTERÍSTICAS
Platinum MasterCard y Visa
•
•
•
Clientes con ingresos iguales o superiores a $8.000.000.
Clientes que requieren cupos altos.
Viajeros frecuentes (negocios y/o turismo).
Gold MasterCard y Visa
•
•
•
Clientes con ingresos superiores a $4.000.000.
Clientes preferenciales del Banco.
Clientes que requieren cupos altos.
Clásica Davivienda MasterCard y Visa
•
•
Clientes con ingresos iguales o superiores a $700.000.
Clientes que están empezando su vida crediticia.
15
•
Clientes con tarjeta MasterCard o Visa, que quieran
apadrinar un familiar o amigo, que no cumpla con los
requisitos estipulados por el banco para acceder a una
tarjeta de crédito.
•
Clientes con ingresos iguales o superiores a un salario
mínimo legal vigente.
Clientes sin historial crediticio que desean obtener una
tarjeta de crédito.
El cliente adquiere tres productos: Certificado de Depósito a
Término (CDT), Cuenta de ahorros con tarjeta débito y
tarjeta de crédito.
Amparada
MasterCard y Visa
•
Garantizadas MasterCard y Visa
•
Empresarial
Cuota fija
•
Exclusiva para clientes corporativos.
•
Clientes con ingresos iguales o superiores a un salario
mínimo legal vigente.
El valor de la cuota mensual a pagar es constante todos los
meses.
•
•
Tarjeta de crédito dirigida exclusivamente a mujeres que
cuenta con beneficios y soluciones especiales de acuerdo a
un nivel de ingresos específico.
Signature Davivienda Visa
•
•
•
•
Clientes con ingresos iguales o superiores a $12.000.000.
Viajeros frecuentes (turismo o negocios).
Clientes selectos del banco (exclusividad).
Requerimiento de cupos altos.
MasterCard Black
•
•
•
•
Clientes con ingresos iguales o superiores a $15.000.000.
Viajeros frecuentes (turismo o negocios).
Clientes selectos del banco (exclusividad).
Requerimiento de cupos altos.
•
Clientes exclusivos que vienen de la fusión Banco Superior –
Davivienda.
Clientes nuevos con ingresos iguales o superiores a
$3.000.000.
Beneficios de Diners Club International.
Mujer Clásica y Premium
Diners
•
•
Tabla 1. Segmentación de las tarjetas de crédito otorgadas por el Banco Davivienda S.A.
Fuente: (DAVIVIENDA S.A., 2006)
Igualmente, el Banco Davivienda S.A. ofrece a sus clientes la posibilidad de adquirir tarjetas de crédito
especializadas, con las cuales pueden acceder a beneficios exclusivos ofrecidos por los diferentes comercios,
de acuerdo con sus intereses y preferencias. Estas tarjetas son ofrecidas con el respaldo de las dos
franquicias: Visa y MasterCard. A continuación, en la tabla 2 se presentan algunas de las tarjetas de crédito
que actualmente se ofrecen a través de la modalidad de marcas compartidas (DAVIVIENDA S.A., 2006).
16
FRANQUICIA
MARCAS COMPARTIDAS
VISA
•
•
•
Avianca
Club Palatino
Scare
MASTERCARD
•
•
Scar
Uniandinos
- Asosalud / Accome
- Comfamiliar
- MNG
- Carulla
- Santafé
- 40 Principales
- Easy
- Buenvivir
- Le Collezioni
Tabla 2. Segmentación de las tarjetas de crédito otorgadas a través de la modalidad de marcas compartidas.
Fuente: (DAVIVIENDA S.A., 2006)
Por otro lado, según el Informe Gerencial de Tarjetas de Crédito que mensualmente actualiza la Unidad de
Inteligencia de Negocios de la Vicepresidencia de Medios de Pago, para el período acumulado entre enero de
2011 y junio de 2011, la línea de negocio de tarjeta de crédito del Banco Davivienda S.A. presentó el siguiente
comportamiento.
Gráfico 5. Situación actual de las tarjetas de crédito dentro del Banco Davivienda S.A. Datos acumulados
(enero 2011 – junio 2011).
Fuente: (DAVIVIENDA S.A., 2011)
De lo anterior se puede concluir que el Banco Davivienda S.A., a través de sus más de treinta clases de
tarjetas de crédito, tiene cubierto un gran porcentaje del mercado de éstas en Colombia. La cobertura que
ofrece con este producto va desde personas naturales con ingreso de salario mínimo, hasta clientes
exclusivos con ingresos de $15.000.000 o más. Esto le permite abarcar diferentes estratos sociales,
cubriendo las necesidades y satisfaciendo las expectativas de sus clientes actuales.
17
1.6.
FORMULACIÓN Y PLANTEAMIENTO DEL PROBLEMA
De acuerdo con el comportamiento histórico de las transacciones realizadas a través de las tarjetas de
crédito, el Departamento de Monitoreo de Medios de Pago del Banco Davivienda S.A. ha identificado que
dentro de las transacciones que registran sus tarjetahabientes (incluye cualquiera de las franquicias: Visa,
MasterCard y Diners) se ha venido presentando un porcentaje significativo de transacciones rechazadas o
declinaciones.
Las declinaciones se presentan cuando el cliente desea acceder a comprar un bien o servicio, o cuando
desea realizar un avance, y la transacción no se concluye exitosamente. Los dos canales por los cuales se
registran estas transacciones son los ATM (por sus siglas en inglés, Automated Teller Machine), o cajeros
electrónicos y las sucursales bancarias, utilizados en los casos de avances en efectivo; los POS (por sus
siglas en inglés, Point Of Sale) o puntos de venta y las compras a través de Internet., utilizados en los casos
de pago y/o compra de bienes y servicios a través de los datafonos de las redes de las franquicias.
Analizando el origen de las transacciones declinadas se ha identificado que las causas que más se presentan
son las siguientes: ATM: Fondos insuficientes, PIN inválido, tarjeta bloqueada, tarjeta vencida y otras. POS:
Fondos insuficientes, tarjeta bloqueada, validación de fecha de vencimiento, código de seguridad errado,
tarjeta robada o extraviada, código de establecimiento errado, datáfono inválido, tarjeta no existe y otras
causas. El gráfico 6 presenta el número de transacciones que se registran a través de cada una de las causas
identificadas.
Gráfico 6. Total de declinaciones presentadas en tarjeta de crédito. Junio de 2011.
Fuente: (DAVIVIENDA S.A., 2011)
18
De lo anterior se puede afirmar que la causa que representa el mayor porcentaje de ocurrencia en las dos
tipos de canales existentes es la debida a Fondos Insuficientes (51% del total de las declinaciones). Se hace
necesario entonces entrar a analizar la posibilidad de crear alternativas de mejora, para disminuir la cantidad
de transacciones rechazadas por este concepto.
Las declinaciones de tarjeta de crédito debidas a Fondos Insuficientes se presentan cuando un determinado
cliente registra su tarjeta en un establecimiento comercial, en un cajero automático, o en otro canal habilitado
por el Banco, y el cupo con el que cuenta en ese momento no es suficiente para permitirle adquirir un bien o
servicio. Lo anterior implica para el Banco Davivienda S.A. que se dejen de generar transacciones, lo que está
ligado directamente con la generación de ingresos. Igualmente se está produciendo un costo adicional; ya
que, de acuerdo con los convenios que el Banco ha pactado con las redes dueñas de las franquicias (Visa y
MasterCard), por cada transacción que se decline se cobra un valor adicional por el uso de la red, ya que se
requiere de la consulta de una base de datos externa. Por otro lado, desde el punto de vista del cliente, una
declinación por fondos insuficientes representa que está perdiendo la oportunidad de adquirir bienes y/o
servicios por sobrepasar su cupo asignado. El gráfico 7 ilustra este proceso.
Gráfico 7. Proceso de autorización de transacciones por fondos insuficientes a través de tarjeta de crédito.
Fuente: La autora
En este orden de ideas, se hace necesario determinar una forma eficaz para otorgar a los clientes una
autorización transaccional, que le permita utilizar un cupo adicional en sus tarjetas de crédito, en ocasiones en
las que su cupo disponible no sea suficiente para adquirir un bien o servicio específico. Cabe anotar que estas
autorizaciones deben ser llevadas a cabo después del análisis de la información con la que cuenta el Banco
Davivienda S.A. de sus tarjetahabientes, y sólo deben ser asignadas a aquellos clientes que lo necesiten y
demuestren un comportamiento adecuado con el Banco.
Es así que para el presente proyecto se determinó hacer uso de herramientas matemáticas y estadísticas,
para establecer un modelo de Minería de Datos que permita al Banco Davivienda S.A analizar la asignación
eficiente de autorizaciones transaccionales de sus tarjetahabientes. Es importante recalcar que el hecho de
otorgar un extra cupo es totalmente diferente a aumentarle su capacidad, cupo o valor máximo asignado.
19
2. SITUACIÓN ACTUAL DEL PROCESO DE VALORACIÓN Y OTORGAMIENTO DE EXTRA CUPOS
EN EL BANCO DAVIVIENDA S.A.
El Banco Davivienda S.A. actualmente cuenta con una gran fuerza de trabajo distribuida en departamentos y
unidades especializadas que le permiten llevar el control de los diferentes negocios de la entidad. Esta
distribución se realiza de acuerdo con los productos ofrecidos a sus clientes y a las necesidades de control de
la organización.
Dentro de la situación específica de las tarjetas de crédito existe un gran número de departamentos
involucrados en su gestión. Sin embargo, hay tres departamentos relevantes que se encargan del control,
monitoreo, seguimiento (de clientes y del producto) y generación de políticas, que aseguran el correcto
funcionamiento de las tarjetas de crédito, y que están alineados con las políticas internas del Banco
Davivienda S.A. Estos departamentos son: Departamento de Análisis de Riesgo de Crédito, Departamento de
Monitoreo de Medios de Pago y la Unidad de Inteligencia de Negocios de la Vicepresidencia de Medios de
Pago.
Con el fin de poner en contexto la relación de estos tres departamentos, la importancia dentro del proceso de
valoración y otorgamiento de extra cupos, y las actividades que se llevan a cabo en cada uno de ellos, a
continuación se presenta una descripción general de éstos.
2.1.
DEPARTAMENTO DE ANÁLISIS DE RIESGO DE CRÉDITO DEL BANCO DAVIVIENDA S.A.
El departamento de Análisis de Riesgo de Crédito se constituyó en el Banco Davivienda S.A. como
consecuencia de una exigencia de la Superintendencia Financiera de Colombia, para controlar el riesgo
asociado a cada uno de los clientes a los que la entidad les ha otorgado un crédito. Es el departamento
encargado de calificar y evaluar las carteras de crédito del Banco, así como de constituir las provisiones
necesarias para absorber las pérdidas esperadas de la exposición de los créditos desembolsados
(DAVIVIENDA S.A., 2011).
Dentro de las labores que se realizan en este departamento se encuentra la generación de modelos de
calificación de crédito basados en la información disponible del cliente, para determinar categorías de riesgo y
clasificar a los clientes de acuerdo con diferentes variables propias de cada uno (actuales e históricas), tales
como: días de mora, créditos activos, nivel de ingresos, nivel de activos, endeudamiento, entre otras. En
general, el objetivo del departamento es mantener un continuo seguimiento de los clientes de la entidad, para
detectar su comportamiento crediticio y poder generar políticas que mitiguen el riesgo de desembolsar un
crédito a una persona natural o jurídica.
20
Con respecto a los cupos otorgados en las tarjetas de crédito y, en general, a los valores máximos asignados
en todos los créditos desembolsados, en este departamento se desarrollan modelos matemáticos alineados
con las exigencias de la Superintendencia Financiera de Colombia, para determinar cuál será el valor del
cupo total que puede ser otorgado a un determinado cliente.
2.2.
DEPARTAMENTO DE MONITOREO DE MEDIOS DE PAGO DEL BANCO DAVIVIENDA S.A.
El departamento de Monitoreo de Medios de Pago está constituido en el Banco Davivienda S.A. como una
estrategia de negocio para dar seguimiento y control constante al comportamiento de las diferentes
herramientas de pago que se le otorgan al cliente, como productos de la entidad. Dentro de los medios de
pago comúnmente utilizados por los clientes se encuentran: las tarjetas débito y las tarjetas crédito.
Este departamento es el encargado de controlar las diferentes redes de pago que se han puesto en los
establecimientos comerciales (a través de datafonos y cajeros automáticos), con el fin de mantener un
constante seguimiento de las transacciones que se realizan a través de éstas. En éste se desarrolla el análisis
de la cantidad de transacciones realizadas en un período determinado, los montos de las transacciones, la
cantidad de declinaciones y sus causas, entre otros indicadores relevantes para la gestión de estos medios de
pago.
2.3.
UNIDAD DE INTELIGENCIA DE NEGOCIOS DE LA VICEPRESIDENCIA DE MEDIOS DE
PAGO DEL BANCO DAVIVIENDA S.A.
La Unidad de Inteligencia de Negocios de la Vicepresidencia de Medios de Pago es la encargada de manejar
los temas relacionados con los medios de pago de la entidad. Está encargada de generar reportes periódicos
del comportamiento de las tarjetas débito y crédito, así como de proponer estrategias de expansión del
negocio en diferentes segmentos comerciales. Las labores dentro de la unidad se miden en términos de
adquisición de nuevos comercios (nuevas oportunidades de negocio para transar con las tarjetas de crédito
disponibles y sus franquicias bajo la figura de Banco Adquirente), la expansión a nuevos nichos de mercado
(marcas compartidas y otros) y el seguimiento y control de las tarjetas de crédito actuales.
En la Unidad de Inteligencia de Negocios de la Vicepresidencia de Medios de Pago se encuentra disponible la
información de la gestión de las tarjetas de crédito, así como la información acerca de su funcionamiento
dentro del Banco Davivienda S.A. Esta información es suministrada al departamento por la gestión propia de
su fuerza laboral, y por otras áreas del Banco que reportan información pertinente (en temas relacionados a la
gestión de los medios de pago) de tarjetas de crédito.
El gráfico 8 presenta la relación entre estos tres departamentos para la gestión del producto de tarjeta de
crédito dentro del Banco Davivienda S.A.
21
Gráfico 8. Relación entre los departamentos del Banco Davivienda S.A. Producto tarjeta de crédito.
Fuente: La autora
2.4.
DESCRIPCIÓN DEL PROCESO ACTUAL
El proceso actual de valoración y otorgamiento de extra cupos dentro del Banco Davivienda S.A. está
determinado por las redes dueñas de las tarjetas de crédito. Para las tarjetas de crédito Diners, el dueño de la
red es directamente el Banco Davivienda S.A.; para las tarjetas de crédito Visa la red propietaria es la Red
Credibanco Visa; y para las tarjetas de crédito MasterCard la red dueña es Redeban Multicolor.
El proceso inicia cuando un cliente realiza una transacción3 a través de los canales habilitados por el Banco
Davivienda S.A.: POS, ATM y otros. El primer paso es determinar a qué red pertenece la tarjeta de crédito
que ha sido presentada y de acuerdo con esto determinar cuál es el camino que debe seguir el procedimiento
de acuerdo con lo estipulado por las redes y el Banco Davivienda S.A., es decir, que cada una de las redes
tiene un procedimiento determinado (DAVIVIENDA S.A., 2009).
Para entender mejor estos procedimientos a continuación se describen cada uno de ellos.
2.4.1.
•
Transacción a través de POS (nivel nacional)
Caso 1: Tarjeta de crédito Diners
Una vez se ha determinado que la tarjeta de crédito pertenece a la franquicia de Diners, se válida sí ha
sido presentada ante un datáfono de la Red Credibanco o de Redeban Multicolor, o a través de un
3
Pueden ser en comercios nacionales e internacionales bajo la modalidad de compra/pago o avances en efectivo.
22
Autorizador del Banco Davivienda S.A. Seguido a esto, cada uno de los medios validan la información
frente al Autorizador 73, Stratus ON/2, en el cual se almacena la base de datos de los clientes de tarjeta
de crédito y es el medio a través del cual se determina sí se acepta la transacción o se declina por alguna
razón.
Sí la transacción ha sido declinada se revisa sí es debida a fondos insuficientes. Si es así, se autoriza
teniendo en cuenta los parámetros autorizados por el Banco Davivienda S.A, si no, se declina la
transacción. El Comité de Riesgo autorizó como política de funcionamiento de todas las tarjetas Diners,
un extra cupo equivalente al 20% del cupo total otorgado en la tarjeta. Esta autorización abarca a todos
los clientes Diners, siempre y cuando al momento de la transacción se encuentren al día con el Banco.
•
Caso 2: Tarjeta de crédito Visa
Una vez se ha determinado que la tarjeta de crédito pertenece a la franquicia Visa, se válida sí ha sido
presentada ante un datáfono de la Red Credibanco o de Redeban Multicolor, o a través de un Autorizador
de la Red Credibanco. El medio encargado de la validación ante el Autorizador 73, Stratus ON/2, es la
Red Credibanco; es decir que sí la transacción fue presentada ante Redeban Multicolor o el Autorizador
de Credibanco, éstos deben enviar la transacción a la Red de Credibanco y esperar a que la red les
responda sí se le autoriza o declina la transacción a ese cliente.
Sí la transacción ha sido declinada por fondos insuficientes, la Red de Credibanco se encarga de validar
la autorización o declinación de la transacción. Una vez se culmina la validación, se autoriza o no el extra
cupo, y se le informa al cliente la decisión. La red se encarga de autorizar el extra cupo de acuerdo con
un puntaje de riesgo. El puntaje de riesgo es un contrato de un modelo de ACIERTA entre la red dueña
de la tarjeta de crédito y Datacrédito, para permitir la consulta en línea de la calificación del cliente y
determinar de acuerdo con esto sí se le autoriza o no el extra cupo, y su monto. La información con la
que se cuenta en el momento de otorgar el extra cupo corresponde a la información con corte a dos
meses anteriores del mes en el que se está realizando la transacción.
•
Caso 3: Tarjeta de crédito MasterCard
Una vez se ha determinado que la tarjeta de crédito pertenece a la franquicia MasterCard, se válida sí ha
sido presentada ante un datáfono de Redeban Multicolor o de la Red Credibanco, o a través de un
Autorizador de Redeban Multicolor. De la misma manera en que opera la Red Credibanco con sus
tarjetas Visa, Redeban Multicolor es la red encargada de validar ante el Autorizador 73, Stratus ON/2 la
autorización o declinación de las transacciones.
Igualmente sí las transacciones han sido declinadas, se sigue el mismo procedimiento es el mismo que
se realiza con las tarjetas de crédito de la franquicia Visa para determinar si se le otorga o no un extra
cupo.
23
Con respecto a los extra cupos otorgados por cada una de las franquicias, es importante aclarar que todos los
clientes del Banco Davivienda S.A. tienen autorizado este servicio. Los extra cupos son aprobados en línea
en el momento de autorizar o declinar una compra.
2.4.2.
•
Transacción a través de ATM (nivel nacional)
Caso 1: Avance en cajeros propios
Cuando el cliente presenta su tarjeta de crédito (de cualquier franquicia) ante un cajero electrónico de la
red del Banco Davivienda S.A. para realizar un avance en efectivo, el proceso interno que se lleva a cabo
consiste en validar la información ante el Autorizador 31 o el Autorizador 38, los cuales están en línea con
cada uno de los cajeros electrónicos disponibles, y éstos a su vez validan la información ante el
Autorizador 73, Stratus ON/2 con el fin de permitir o declinar la transacción.
•
Caso 2: Avance en cajeros de otras redes
En el caso en el que el cliente presenta su tarjeta de crédito ante cualquier cajero electrónico del
comercio, es decir, cajeros electrónicos que están vinculados a otras redes, el proceso interno que se
lleva a cabo consiste en enviar la transacción a la red dueña de la franquicia de la tarjeta de crédito, y
luego éstos serán los encargados de autorizar o declinar la transacción. Sí la transacción ha sido
rechazada por fondos insuficientes, las redes dueñas de las franquicias se encargan de consultar el
archivo de ACIERTA proporcionado por Datacrédito, para determinar sí se le otorga o no un extra cupo a
ese cliente.
•
Caso 3: Avance en canales propios
El Banco Davivienda S.A. les permite a sus clientes realizar avances en efectivo a través de cualquiera
de los canales que tiene habilitados para ello. Dentro de los canales del Banco se encuentran: Internet,
Teléfono Rojo de Davivienda y las Sucursales Bancarias. Sí el cliente se presenta con su tarjeta de
crédito ante cualquiera de estos canales para solicitar un avance en efectivo, el proceso que sigue la
transacción consiste en que, a partir del canal se transmite la información al Integrador de Canales, se
válida la información ante el Autorizador 31 y este a su vez válida la información ante el Autorizador 73
Stratus ON/2. Después de este proceso se determina sí se le autoriza o no la transacción al cliente.
2.4.3.
Transacción a través de ATM/POS (nivel internacional)
24
•
Caso 4: Autorizaciones Internacionales.
El flujo de información surge cuando el cliente se presenta ante un comercio internacional. El proceso
consiste en validar la información ante el Banco Adquirente, el cual, a su vez se encarga de contactar la
red Visa/ Master Internacional, y estas últimas se contactan con la red nacional y validan la información
de la misma manera que se hace en el comercio nacional. Para el caso de Diners, el Banco Davivienda
S.A. se encarga directamente de la autorización a través de la plataforma tecnológica que tiene destinada
para estas operaciones.
2.5.
POLÍTICAS Y GENERALIDADES DEL PROCESO
De acuerdo con las políticas que el Banco Davivienda S.A. ha establecido para el funcionamiento del proceso
de valoración y otorgamiento de extra cupos dentro de la entidad, se ha estipulado que los canales a través
de los cuales se les otorgan extra cupos a los tarjetahabientes dependen de la franquicia de la tarjeta de
crédito y la propiedad del canal habilitado. Es decir, para la franquicia Diners se autorizan extra cupos a través
de cualquier canal, y en las franquicias Visa y MasterCard solamente se realiza la autorización de extra cupos
a través de POS a nivel nacional e internacional, de ATM de otras redes y a través de ATM a nivel
internacional.
Por otro lado, el proceso de valoración y otorgamiento de extra cupos a los tarjetahabientes del Banco
Davivienda S.A. en las tarjetas de crédito de Visa y MasterCard, está directamente relacionado con la
consulta de la base de datos de ACIERTA, en los canales mencionados anteriormente. En esta base está
consignada toda la información histórica del cliente referente a su comportamiento crediticio, lo que implica
que cada uno de los clientes tiene una calificación de crédito por su comportamiento histórico4.
Adicionalmente, el tipo de tarjeta de crédito asignada al cliente (Clásica, Gold, Platinum) es otro parámetro
que se tiene en cuenta para otorgarle al cliente una autorización transaccional.
La tabla 3 presenta una ponderación aproximada de los parámetros que se tuvieron en cuenta en el año 2010
para el otorgamiento de extra cupos dentro del Banco Davivienda S.A.
Una forma de medir el comportamiento histórico en los créditos de los clientes es a partir de la calificación de crédito, la
cual está medida en términos de las alturas de mora que haya presentado el cliente en los últimos 36 meses (36 meses
inmediatamente anteriores al período de corte en el que se esté analizando), junto con otras variables de
comportamiento y un modelo de calificación establecido por la Superintendencia Financiera de Colombia. Las
calificaciones van de la A hasta la E. Una calificación A implica que el cliente tiene un riesgo de incumplimiento normal
(aproximadamente entre 0 y 29 días de mora), B un riesgo de incumplimiento aceptable (aproximadamente entre 30 y 59
días de mora), C un riesgo de incumplimiento apreciable (entre 60 y 89 días de mora), D un riesgo de incumplimiento
significativo (entre 90 y 119 días de mora) y E un riesgo de incumplimiento incobrable (mayor o igual a 120 días de mora)
(SUPERINTENDENCIA FINANCIERA DE COLOMBIA, 2005).
4
25
TRANSACCIONES
INTERNACIONALES
TRANSACCIONES NACIONALES
FRANQUICIA
PRODUCTO CALIFICACIÓN
CLASICA
VISA
GOLD
PLATINUM
CLASICA
MASTER
GOLD
PLATINUM
%Nacional
POS
#Cuotas
%Nacional
#Cuotas
#Cuotas
%Nacional
Nacional %Internal
pagos
Nacional
Internal
ATM
pagos
POS
recurrentes
POS
POS
recurrentes
%Internal
ATM
A
20
24
10
10
12
20
12
10
B
15
24
10
10
12
15
12
10
C
0
0
0
0
0
0
0
0
A
30
24
15
12
12
30
12
15
B
20
24
10
8
12
20
12
10
C
0
0
0
0
0
0
0
0
A
40
24
20
10
12
40
12
20
B
30
24
15
10
12
30
12
15
C
0
0
0
0
0
0
0
0
A
20
24
10
10
12
20
12
10
B
15
24
10
10
12
15
12
10
C
0
0
0
0
0
0
0
0
A
30
24
15
12
12
30
12
15
B
20
24
10
8
12
20
12
10
C
0
0
0
0
0
0
0
0
A
40
24
20
10
12
40
12
20
B
30
24
15
10
12
30
12
15
C
0
0
0
0
0
0
0
0
Tabla 3. Ponderación aproximada de los porcentajes de extra cupos otorgados por el Banco Davivienda S.A.
a través de las franquicias Visa y MasterCard, 2010.
Fuente: (BANCO DAVIVIENDA S.A., 2010)
Es importante destacar que el servicio de extra cupos no tiene costo adicional para el cliente, y que el manejo
que se le da es el mismo que se realiza con las compras y avances; es decir, no implica ningún cambio en los
parámetros de crédito ofrecidos al cliente en el momento de otorgarle su tarjeta de crédito. De igual manera el
cliente desconoce que cuenta con el servicio de extra cupos, pero sí en algún momento desea no obtener
este beneficio, puede pedir al Banco Davivienda S.A. que le sea anulado.
Por otro lado, desde el punto de vista del Banco, el servicio de extra cupos tiene un costo, ya que la consulta
de la base de datos de ACIERTA que ofrece Datacrédito es cobrada a la red (Visa, MasterCard), y estas a su
vez, cobran este servicio al Banco Davivienda S.A. por cada transacción consultada (se genere extra cupo o
no). En el caso en el que la transacción haya sido declinada, el Banco Davivienda S.A. cobra al
tarjetahabiente la declinación de la transacción5 en la próxima factura.
Finalmente, la tabla 4 presenta la información relacionada con el valor por transacción consultada en
ACIERTA, el número de transacciones consultadas y el valor total de éstas en el año 2010.
El valor promedio de cada transacción rechazada es de $5.000 y sólo le es cobrado a los clientes con tarjetas de
crédito clásicas. Por políticas que el Banco Davivienda S.A. ha considerado para el funcionamiento de este producto, las
tarjetas de crédito Gold y Platinum de las franquicias Visa y MasterCard, y las tarjetas de crédito Diners en cualquiera de
sus segmentos están exentas de este cobro.
5
26
CREDIBANCO
MES
Cantidad
Tx
ENERO
FEBRERO
MARZO
ABRIL
MAYO
JUNIO
JULIO
AGOSTO
SEPTIEMBRE
OCTUBRE
NOVIEMBRE
DICIEMBRE
TOTAL
12.589
11.004
9.425
11.051
9.781
10.915
12.864
13.480
12.961
6.967
15.089
16.989
143.115
REDEBANMULTICOLOR
Cantidad
Tarifa ( $) Valor ($M)
Tarifa ( $) Valor ($M)
Tx
592
604
604
604
604
604
604
604
604
641
604
604
605
7.453
6.646
5.693
6.675
5.908
6.593
7.770
8.142
7.828
4.466
9.114
10.261
86.548
30.771
24.167
22.180
22.343
11.409
26.345
24.036
27.041
27.486
38.109
28.915
28.023
310.825
774
774
774
774
774
774
774
774
774
774
774
774
774
23.817
18.705
17.167
17.293
8.831
20.391
18.604
20.930
21.274
29.496
22.380
21.690
240.579
Tabla 4. Número y valor de las transacciones consultadas en ACIERTA a través de las franquicias Visa y
MasterCard, 2010.
Fuente: (BANCO DAVIVIENDA S.A., 2010)
2.6.
DIAGRAMAS DE PROCESO
Con el fin de comprender el proceso actual de valoración y otorgamiento de extra cupos en las transacciones
realizadas a través de tarjeta de crédito de cualquiera de las franquicias, y en cada uno de los canales que el
Banco Davivienda S.A. ha habilitado para ello, a continuación se presentan los diagramas de proceso
correspondientes. En primera medida se hace una representación gráfica de cada uno de los procesos,
seguido del respectivo diagrama de flujo.
27
2.6.1.
28
Proceso de valoración y otorgamiento de extra cupos a través de POS a nivel nacional
2.6.1.1.
Diagrama de flujo del proceso de valoración y otorgamiento de extra cupos a través
de POS a nivel nacional en la franquicia Diners
29
2.6.1.2.
Diagrama de flujo del proceso de valoración y otorgamiento de extra cupos a través
de POS a nivel nacional en las franquicias Visa y MasterCard
30
2.6.2.
31
Proceso de valoración y otorgamiento de extra cupos a través de ATM (propios y de otras redes) y canales propios a nivel nacional
2.6.2.1.
Diagrama de flujo del proceso de valoración y otorgamiento de extra cupos a través
de ATM propios a nivel nacional en las franquicias Diners, Visa y MasterCard
32
2.6.2.2.
Diagrama de flujo del proceso de valoración y otorgamiento de extra cupos a través
de ATM de otras redes a nivel nacional en las franquicias Diners, Visa y MasterCard
33
2.6.2.3.
Diagrama de flujo del proceso de valoración y otorgamiento de extra cupos a través
de canales propios a nivel nacional en las franquicias Diners, Visa y MasterCard
34
2.6.3.
35
Proceso de valoración y otorgamiento de extra cupos a través de ATM de otras redes a nivel nacional
2.6.4.1. Diagrama de flujo para el proceso de valoración y otorgamiento de extra cupos a través de
POS / ATM a nivel internacional en la franquicia Diners
36
2.6.4.2. Diagrama de flujo para el proceso de valoración y otorgamiento de extra cupos a través de
POS / ATM a nivel internacional en las franquicias Visa y MasterCard
37
3. SISTEMA DE INFORMACIÓN RELACIONADO CON EL PROCESO DE VALORACIÓN Y
OTORGAMIENTO DE EXTRA CUPOS EN EL BANCO DAVIVIENDA S.A.
El sistema de información actual del Banco Davivienda S.A. ha tenido varias adaptaciones como
consecuencia de la fusión con el Banco Superior y Bancafé. Las tres entidades contaban con sistemas de
gestión y administración diferentes, por lo que el Banco Davivienda S.A. debió tener en cuenta dentro del
proceso de empalme, la integración de los clientes, la integración de las plataformas tecnológicas, la
unificación de los empleados y los productos, y así mismo, asumir los riesgos que se generaron durante todo
este proceso. A partir del año 2008, el Banco Davivienda S.A. impulsó una estrategia encaminada a
desarrollar y ofrecer productos únicos y diferenciados, con los que se hacían necesarios, procesos de
comunicación más eficientes, brindar un mejor servicio al cliente y mejorar las relaciones entre los
involucrados (Cera Bilbao & Maya Quintero, 2009).
El Banco Davivienda S.A. decidió apoyarse en tecnologías de la información para optimizar los servicios que
se ofrecen a sus clientes y los procesos que se llevan a cabo dentro de la entidad. Fue así como se evaluaron
las diferentes metodologías del Banco y las herramientas disponibles hasta el momento. Igualmente se hizo el
análisis del costo – beneficio, con el fin de asegurar que las herramientas tecnológicas realmente se ajustaran
a las nuevas necesidades de la organización.
Actualmente el Banco Davivienda S.A. cuenta con un sistema de información más integrado que le permite
tener acceso a múltiple información de sus productos, clientes, procesos, entre otros. El propósito general de
éste es que todas las áreas de la organización que demanden información puedan tener acceso fácil y rápido
a la bodega de datos, para extraer información que les sirva de soporte en procesos como: resolución de
procedimientos operativos, integración de datos, generación de conocimiento y toma de decisiones. Para ello
se han generado usuarios en cada una de las áreas involucradas (que han sido llamadas áreas clientes), y
sólo a través de éstas se puede consultar y generar información (Ibídem, p.38).
De esta forma, en este apartado se hace un contexto de la situación actual del sistema de información del
Banco Davivienda S.A. relacionado con las tarjetas de crédito y los clientes de la entidad. Se hace una
descripción general de las relaciones que existen entre las bases de datos de los clientes del Banco y la
información del comportamiento y los movimientos del producto de tarjetas de crédito.
3.1.
DESCRIPCIÓN DEL SISTEMA DE INFORMACIÓN
El almacén de datos (DW, por sus siglas en inglés, Data Warehouse) con el que actualmente cuenta el Banco
Davivienda S.A., trabaja en un entorno Oracle y es un modelo único de datos que suministra la información
pertinente para el análisis y la toma de decisiones dentro de la organización; es decir, tiene una estructura
integrada, organizada, dinámica y de fácil exploración y explotación, en la que sólo se dispone de información
relevante de los diferentes procesos de la entidad.
38
Este almacén de datos fue construido a partir de un entorno de trabajo y procesos de datos orientados a
satisfacer los requerimientos de información internos del Banco, y por lo tanto, es un repositorio de datos
históricos de la entidad, para el cual sólo están permitidos dos tipos de operaciones: operaciones de carga de
los datos procedentes de los aplicativos (carga inicial y carga periódica) y la operación de consulta de éstos
(Ibídem, p. 38).
El funcionamiento del almacén de datos del Banco Davivienda S.A. está ligado al cumplimento de tres
objetivos fundamentales que están ceñidos a exigencias internas y externas de la organización6. El gráfico 9
representa dichos objetivos.
Gráfico 9. Objetivos del almacén de datos del Banco Davivienda S.A.
Fuente: Adaptado de (Cera Bilbao & Maya Quintero, 2009)
3.2.
ESTRUCTURA DEL SISTEMA DE INFORMACIÓN7
El proceso de obtención y alimentación de información que va a ser depositada en el almacén de datos tiene
dos componentes principales: la información relacionada con el cliente y la información relacionada con las
transacciones realizadas a través de las tarjetas de crédito. Para el primer caso, el proceso se inicia cuando
se les entrega un formulario a los clientes nuevos en una sucursal bancaria, se diligencia, y luego todo el
Las exigencias externas hacen referencia al cumplimiento de la normatividad relacionada con el manejo de la
información del cliente (almacenamiento, reporte y confidencialidad de la información). Las exigencias internas hacen
referencia al cumplimiento de los requerimientos de información de la organización para llevar a cabo los procesos
internos.
7 Esta información fue consultada directamente con el personal encargado de manejar el sistema de información. Las
áreas consultadas fueron Planeación y Sistema de Información Gerencial del Banco Davivienda S.A.
6
39
consolidado de formularios diligenciados se envían al departamento de Evaluación de Crédito, donde se hace
un cargue manual de dichos datos al sistema de información. Toda esta información reposa en el aplicativo
BUK (Base Única de Clientes).
En el segundo caso, la información viaja a la plataforma SEI (Sistema de Establecimientos e Intercambio)
luego de haberse generado la transacción a través de alguna de las redes del Banco Davivienda S.A., o a
través de las redes de algún otro establecimiento bancario. Esto implica que se registra la información de las
transacciones realizadas a través de ATM, POS, Teléfono Rojo, Davivienda.com y Banca Móvil. Seguido a
esto, la información organizada viaja al aplicativo FACT del AS400. Por otro lado, con respecto a los
movimientos que se realizan en las tarjetas de crédito (cancelaciones, bloqueos, aumento de cupos, cambio
de información del tarjetahabiente, entre otras) la información una vez generada, viaja directamente al
aplicativo FACT.
Adicionalmente, sí un usuario desea hacer una consulta de la información allí consignada, el proceso que se
sigue es: primero, se hace la consulta de la información en un entorno SQL (sí el área que demanda la
información no tiene acceso a ésta, se debe hacer un requerimiento de información a las áreas autorizadas
para consultar la información); segundo, una vez obtenida la información se consolidan las bases de datos en
documentos de Excel o Access (dependiendo del tamaño de la base de datos); y finalmente, se realiza el
intercambio de información con el área o persona que haya requerido la información. El intercambio de
información se realiza a través del correo interno del banco, o en muchos casos, a través de carpetas
compartidas habilitadas entre los usuarios de las diferentes áreas.
El gráfico 10 presenta la estructura del almacén de datos actual relacionado con las tarjetas de crédito y los
tarjetahabientes del Banco Davivienda S.A.
Gráfico 10. Estructura del almacén de datos del Banco Davivienda S.A.
Fuente: La autora
40
Igualmente, para que la información pueda ser consolidada en el almacén de datos, éste debe contar
diferentes niveles, de acuerdo con la etapa del manejo de los datos. El gráfico 11 presenta los niveles con los
que cuenta el almacén de datos del Banco Davivienda S.A.
Gráfico 11. Niveles del almacén de datos del Banco Davivienda S.A.
Fuente: La autora.
3.3.
PROCESO DE GENERACIÓN DE DATOS
Como se ha expuesto anteriormente, el almacén de datos con el que cuenta el Banco Davivienda S.A. sirve
como base para la realización de las actividades y labores de las áreas involucradas en la toma de decisiones
y generación de estrategias que mejoran constantemente el negocio. El área de Informática del Banco
Davivienda S.A. es la encargada de obtener, organizar y arreglar la información que reposa en el almacén de
datos. La realización de estas tareas requiere de un proceso organizado en el que se extrae, limpia y
transforma la información relevante para que después pueda ser consultada y manipulada por los usuarios de
la entidad.
El proceso que se sigue comienza con la extracción de la información, en el que se determina cuáles serán
las fuentes de información, qué datos se desean almacenar, cómo se van a organizar y la disponibilidad de
éstos en el tiempo. En el caso específico del producto de tarjeta de crédito, el almacén de datos obtiene la
información de los movimientos, los saldos y la información transaccional directamente de los dispositivos y
aplicativos que el Banco Davivienda S.A. ha dispuesto para ello (Cera Bilbao & Maya Quintero, 2009).
El siguiente paso es la limpieza y transformación de los datos obtenidos, en éste se corrigen los errores en los
datos, se valida la información, se identifican datos ausentes, se limpian y manejan las excepciones, se
eliminan los duplicados e inconsistencias, se borran los campos que no generan interés, se generan claves,
se adicionan datos, se homogenizan los datos y se realizan todas las actividades que sean pertinentes para
asegurar que la información que vaya a ser consultada por los usuarios sea útil, oportuna y genere valor en
los procesos. Culminado este proceso se procede a cargar los datos en el almacén de datos, dentro del cual
41
además de introducir los datos al almacén, se tienen en cuenta algunos controles de calidad de la información
(Ibídem, p. 41).
Es importante destacar que los controles en la calidad de los datos están encaminados a asegurar que la
información que está disponible es confiable y corresponde a los requerimientos de los diferentes niveles del
almacén de datos dentro de la organización. El personal encargado no tiene permisos para manipular, extraer
o modificar la información que se carga, ya que a través de bloqueos en los permisos al acceso a la
información, tan sólo se pueden hacer modificaciones y limpieza a los datos teniendo en cuenta unos
parámetros específicos. En general, el personal sólo está habilitado para modificar la forma de los datos (con
el fin de estandarizar la información contenida en el almacén de datos), más no tiene la posibilidad de eliminar
o cambiar datos. Algunas de las validaciones más comunes están relacionadas con los datos numéricos que
contiene el Sistema de Información, es así como se rectifican características como: los separadores de miles,
los separadores de decimales, los rangos de edad permitidos, el tamaño del campo que contiene los
números de cédula, el tamaño del campo que contiene los números de producto, entre otros.
Este proceso requiere de especial cuidado ya que por disposiciones legales, la información contenida en las
bases de datos del Banco Davivienda S.A. debe ser custodiada permanentemente para impedir la fuga o
manipulación indebida de la información. Esto con el fin de evitar la exposición de información sensible de los
clientes (datos personales y/o datos de comportamiento transaccional o de productos) y asegurar que las
áreas y departamentos que hacen uso de esta información puedan llevar a cabo correctamente los procesos
internos de la entidad.
Una vez se tiene lista la información le es informado a los usuarios que ya se encuentran disponibles los
datos y que a partir de ese momento se pueden empezar a realizar consultas. Las consultas sólo se hacen
posibles después de que el área de Informática haya definido el orden de las fases de carga y la periodicidad
de la información, pues esto evita que se viole la seguridad de la información, la carga se pueda realizar con
mayor facilidad, y sí es necesario, se pueda hacer un mantenimiento al almacén de datos. Todo lo anterior
para que las consultas sean realizadas sin saturar el funcionamiento del almacén de datos. Estas actividades
se realizan mensualmente a través de un sistema especializado llamado ETL (por sus siglas en inglés,
Extraction, Transformation, Load). Adicionalmente, se llevan a cabo actividades como copias de seguridad y
restauración de la información que reposa en el almacén de datos y de la información que circula desde las
fuentes hasta el almacén de datos (Ibídem, p. 41).
El área de Informática del Banco Davivienda S.A. ha definido que la periodicidad de la información disponible
no debe ser mayor a dos años, por lo que los procesos de copias de seguridad tienen como objetivo guardar
la información que supera este período de tiempo y no se encuentra disponible en la bodega de datos
(Ibídem, p. 41).
El gráfico 12 ilustra el proceso descrito anteriormente.
42
Gráfico 12. Proceso de obtención de datos a través del almacén de datos del Banco Davivienda S.A.
Fuente: La autora.
Una vez los datos están listos y cargados en el almacén de datos los usuarios tienen la posibilidad de
consultar dicha información. Para ello se debe seguir un procedimiento que empieza con la definición de los
datos que se requieren, el estudio del requerimiento, la extracción de la información de la bodega y la
consolidación de bases de datos para su posterior análisis y generación de conocimiento.
3.4.
DIAGRAMAS DE PROCESO
A continuación se presenta el diagrama de flujo de proceso, el diagrama de contexto y el diagrama de nivel
cero, con el fin de representar con claridad el proceso de generación de datos a través del almacén de datos
del Banco Davivienda S.A.
43
3.4.1.
Diagrama de flujo del proceso de generación de datos relevantes para la elaboración de
informes y toma de decisiones
BANCO DAVIVIENDA S.A.
No. 008
Pág. 1 de 1
PROCEDIMIENTO: Generación de datos relevantes para la elaboración de informes y toma de decisiones.
DEPARTAMENTO: Áreas clientes del Almacén de Datos.
Caso: Unidad de Inteligencia de Negocios de la Vicepresidencia de Medios de Pago.
UNIDAD DE INTELIGENCIA DE NEGOCIOS DE LA
VICEPRESIDENCIA DE MEDIOS DE PAGO
ALMACÉN DE DATOS
ÁREA DE INFORMÁTICA
INICIO
Realizar el
requerimiento de
información
Enviar
requerimiento al
Almacén de Datos
¿La
información se
encuentra
disponible en
el DW?
¿La
información es
necesaria para
la toma de
decisiones?
Recibir el
requerimiento de
información
Recibir el informe
del Almacén de
Datos
Evaluar el
requerimiento
¿La
información
será útil para
otras áreas?
SI
NO
1
SI
NO
Extraer la
información
requerida
Buscar
información en
fuentes alternas
Validar la
información
extraída
Extraer la
información
requerida
¿La
información es
consistente?
NO
Comunicar la
inconsistencia al
área de
Informática
SI
Realizar los
cruces necesarios
SI
Solicitar la
información en el
área interesada
NO
Desarrollar el
requerimiento
Informar al área
demandante de
información
Entregar informe
al área de
Informática
Desarrollar el
requerimiento de
información
Validar la
información
solicitada
Cargar la
información al
almacén de datos
Informar sobre la
disponibilidad de
la información en
el DW
SI
¿Se deben
realizar cruces
con otras
bases de
datos?
1
NO
Analizar la
información
disponible
Revisar las
inconsistencias
Generar informes
y tomar decisones
FIN
Fecha: Julio de 2011
Elaborado por: Paola Beltrán Herrera
44
Estado: ACTUAL
3.4.2.
Fecha: Julio de 2011
45
Elaborado por: Paola Beltrán Herrera
Estado: ACTUAL
Diagrama de contexto del Sistema de Información para la generación de información dentro del Banco Davivienda S.A.
Diagrama de Nivel 0
Fecha: Julio de 2011
3.4.3.
46
Elaborado por: Paola Beltrán Herrera
Estado: ACTUAL
En general, el sistema de información que permite la generación de datos dentro del Banco Davivienda S.A.
es una herramienta importante para el correcto funcionamiento de las áreas encargadas de generar informes
y tomar decisiones dentro de la entidad. Sin embargo, aunque se tiene un proceso ya determinado y que está
en constante desarrollo y mejora, éste aún presenta algunas fallas que interrumpen y retrasan las labores que
se desarrollan en cada una de las áreas que requieren de esta información.
Uno de los mayores inconvenientes con respecto a la generación de datos es que los requerimientos de
información tardan mucho tiempo en ser analizados por el área encargada, pues se deben atender los
requerimientos en el orden de prioridad y necesidad de la información. Adicionalmente, se debe tener
presente que las bases de datos resultantes pueden contener algunos datos faltantes y errores (a pesar de
que antes de que la información sea cargada al almacén de datos, éstos pasan por un proceso de limpieza)
los cuales deben ser identificados y arreglados previamente, para poder llevar a cabo el proceso de
generación de conocimiento.
Se puede concluir entonces, que antes de empezar el proceso de análisis y modelamiento de los datos para
crear mecanismos de Minería de Datos, se deben tener en cuenta los siguientes aspectos: (i) la ubicación de
los datos, (ii) los campos disponibles (variables), y (iii) los permisos para el acceso a la bodega de datos. Con
respecto a la ubicación de los datos se puede afirmar que, en el caso específico de las tarjetas de crédito, los
tarjetahabientes de la entidad y las transacciones declinadas por fondos insuficientes, la ubicación de la
información es el aplicativo FACT del sistema de información AS400 y el sistema de información BUK. En
relación con los campos o variables disponibles, en el Anexo C del presente documento se presenta un
resumen de las variables que están disponibles en la bodega de datos del Banco Davivienda S.A., y que se
relacionan directamente con el caso de estudio.
Por último, cabe destacar que una vez se hayan validado cada uno de los aspectos anteriormente
mencionados, se debe formalizar el requerimiento de información, y bien sea el caso, descargar la
información directamente de la bodega de datos, o enviar el requerimiento a un área con acceso permitido a
la bodega de datos, para que descargue la información. La consolidación de la información en herramientas
de Microsoft Office (Excel y/o Access), el tratamiento de los datos y la generación de conocimiento para la
toma de decisiones, dependen directamente del objetivo del proyecto y del personal encargado de éste.
47
4.
DICCIONARIO DE DATOS
Con el fin de presentar y explicar las variables que se extrajeron del almacén de datos del Banco Davivienda
S.A. para desarrollar el mecanismo de Minería de Datos que permita analizar la valoración y otorgamiento de
extra cupos dentro de la entidad, a continuación se presenta la descripción de la metodología utilizada para
seleccionar las variables, la descripción del procedimiento que se llevó a cabo para la obtención de esta
información y la descripción de los campos obtenidos.
4.1.
GENERALIDADES
Teniendo en cuenta el objetivo general del presente trabajo de grado8 y la información disponible en la
bodega de datos, se realizó el análisis de las variables que describen el proceso de valoración y otorgamiento
de extra cupos dentro del Banco Davivienda S.A., y que podrían ser relevantes para incluirlas en el proceso
de generación del mecanismo de Minería de Datos. Se identificó que la muestra de datos seleccionada debía
cumplir con el objetivo de describir las transacciones realizadas por alguno de los canales habilitados por la
entidad, y que dichas transacciones debían haber sido declinadas por fondos insuficientes.
El gráfico 13 ilustra la muestra de datos de interés para el desarrollo del presente trabajo de grado.
Gráfico 13. Muestra de datos extraídos del Almacén de Datos.
Fuente: La autora
De acuerdo con lo anterior, la información recopilada cumplió con las siguientes características:
•
Se obtuvo una muestra de las transacciones declinadas por fondos insuficientes para el período de
un año. Transacciones declinadas entre junio de 2010 y junio de 2011.
Objetivo General: Determinar un mecanismo basado en Minería de Datos que permita hacer eficiente la autorización
ocasional de transacciones o extra cupos a los tarjetahabientes del Banco Davivienda S.A.
8
48
4.2.
•
La muestra sólo incluyó las transacciones realizadas bajo la modalidad de compra. Esto incluye
transacciones registradas a través de POS, ya sean presenciales (datafono) o no presenciales
(compras por Internet).
•
Se incluyeron las transacciones realizadas con tarjetas de todas las franquicias: Visa, MasterCard,
Diners y Marcas Compartidas.
•
Se tomó en cuenta el total de tarjetas de crédito vigentes a Julio de 2011.
•
Para los clientes que tienen tarjetas de crédito bajo la modalidad de amparadas se tomó como
cliente al amparador, y para las tarjetas de crédito bajo la modalidad de extendidas se tomó como
cliente al dueño de la tarjeta principal. De esta forma, el número total de tarjetas de crédito por
cliente hace referencia a las tarjetas que el cliente tiene como titular de las tarjetas propias y
extendidas, y como amparador.
METODOLOGÍA
Como se había identificado con anterioridad, el área encargada del monitoreo y control de las tarjetas de
crédito dentro del Banco Davivienda S.A. es el área de Monitoreo de Medios de Pago. Basados en esto, se
pasó el requerimiento de información a dicha área, con el fin de obtener las transacciones declinadas por
fondos insuficientes en el período determinado. El resultado obtenido fue una base de datos inicial con un
total de 1.302.662 transacciones declinadas por este concepto.
Posteriormente, a la Unidad de Inteligencia de Negocios de la Vicepresidencia de Medios de Pago se le hizo
el requerimiento de información de los clientes con tarjetas de crédito vigentes a Julio de 2011. Se obtuvo una
base de datos con 1.710.046 de tarjetas vigentes a la fecha de corte y la descripción detallada del producto
en 92 campos.
Una vez se tuvo esta información, se realizó el cruce por tarjeta de crédito de las dos bases originales, con el
fin de obtener el número de clientes con tarjetas de crédito vigentes, que habían transado en el comercio y les
habían sido declinadas sus transacciones por fondos insuficientes. Luego del cruce se obtuvo una base con
1.070.791 transacciones declinadas. Lo anterior implica que 231.871 transacciones de la base de datos
original (18% de las transacciones) fueron realizadas con tarjetas de crédito que a la fecha de corte ya no
están vigentes.
Igualmente se identificó que existe un total de 195.018 clientes con transacciones declinadas por fondos
insuficientes en el período analizado, y un total de 259.876 tarjetas de crédito asociadas a estas
declinaciones. En promedio se declinaron 5 transacciones por cliente.
49
La tabla 5 muestra la descripción de los campos de la base de datos inicial de las transacciones declinadas
por fondos insuficientes.
NOMBRE
NO. DE TARJETA
RED LÓGICA ALMACÉN
DESCRIPCIÓN DEL CAMPO / VARIABLE
Contiene los 16 dígitos del número de la tarjeta de crédito.
Para las tarjetas de crédito:
• Visa: 16 dígitos que comienzan en 4.
• MasterCard: 16 dígitos que comienzan en 5.
• Diners / Marcas Compartidas: 16 dígitos que comienzan con
0036.
Contiene la información de la red por la que se registró la transacción.
Longitud 4.
• VSI: Visa Internacional.
• MCI: MasterCard Internacional.
• DAVI: Diners Nacional.
• ASCR: Credibanco Visa.
• PRO1: Redeban Multicolor.
• DCI: Diners Internacional.
TIPO DE
VARIABLE
Texto.
Texto.
Contiene el número de identificación del comercio a través del cual se
realizó la transacción. Longitud 10.
Texto.
FECHA TRX
Contiene la fecha de transacción. Cadena de 8 dígitos.
Primero se identifica el año, luego el mes y finalmente el día.
Ejemplo: 01 de enero de 2011.
“20110101”.
Texto.
HORA TRX
Contiene la hora de la transacción. Cadena de 8 dígitos.
Primero se identifica la hora, luego los minutos, los segundos y
finalmente los milisegundos.
Ejemplo: 13:40:22:00
“13402200”.
Texto.
NOMBRE DEL
ALMACÉN
Contiene la cadena de caracteres asociada al código del almacén donde
se realizó la transacción. Longitud 22.
Texto.
TIPO TRX
Contiene una cadena de 2 dígitos que indica el tipo de transacción
realizada.
• Para transacciones de compras: 10
Texto.
DISPOSITIVO
Contiene el indicador del dispositivo por el cual se registró la
transacción.
• P: Transacciones de compra a través de datafono o canal de
internet.
Texto.
Contiene el valor total de la transacción realizada.
Doble.
Indica la causa del rechazo de la transacción. Longitud 4.
• 8348: Declinación por fondos insuficientes.
Texto.
CÓDIGO ALMACÉN
MONTO
CÓDIGO RECHAZO
50
POS ENTRY MODE
Cadena de dos dígitos que indica el dispositivo electrónico que recibió la
transacción.
• 00 – 01: Transacciones no presenciales. A través de internet.
• 02: Tarjeta con banda magnética.
• 05: Tarjeta con chip.
• 82 – 80: Código de validación entre el datafono y el chip y la tarjeta
de crédito.
Texto.
Tabla 5. Diccionario de datos de la base inicial de transacciones declinadas por fondos insuficientes
Fuente: La autora.
Adicionalmente, la tabla 6 presenta la descripción de algunos de los campos de la base de datos
correspondiente a las tarjetas de crédito vigentes a julio de 2011.
NOMBRE
DESCRIPCIÓN DEL CAMPO
TIPO DE
VARIABLE
Contiene los 16 dígitos del número de la tarjeta de crédito.
Para las tarjetas de crédito:
• Visa: 16 dígitos que comienzan en 4.
• MasterCard: 16 dígitos que comienzan en 5.
• Diners / Marcas Compartidas:14 dígitos que comienzan con 36
Texto.
Indica el tipo de identificación del cliente:
• 1: Cédula de ciudadanía.
• 2: Cédula de extranjería.
• 3: N.I.T.
• 4: Tarjeta de identidad.
• 5: Pasaporte.
Texto.
FECHA ACTIVACIÓN
Contiene la fecha de activación del producto. Cadena de 8 dígitos.
Primero se identifica el año, luego el mes y finalmente el día.
Ejemplo: 01 de enero de 2011.
“20110101”.
Texto.
TIPO TARJETA
Contiene la descripción del tipo de tarjeta otorgada al cliente. Letra que
identifica el tipo de tarjeta.
• A: Amparada.
• E: Extendida.
• P: Principal.
Texto.
FECHA 1ª COMPRA
Contiene la fecha de la primera compra que se realizó con el producto.
Cadena de 8 dígitos.
Primero se identifica el año, luego el mes y finalmente el día.
Ejemplo: 01 de enero de 2011.
“20110101”.
Texto.
VALOR 1A COMPRA
Contiene el valor total de la primera compra realizada con el producto.
Doble.
NO. DE TARJETA
TIPO IDENTIFICACIÓN
51
FECHA 1ª AVANCE
Contiene la fecha del primer avance que se realizó con el producto.
Cadena de 8 dígitos. Primero se identifica el año, luego el mes y
finalmente el día.
Ejemplo: 01 de enero de 2011.
“20110101”.
Texto.
VALOR 1ª AVANCE
Contiene el valor total del primer avance realizado con el producto.
Doble.
CUPO APROBADO
Cupo máximo otorgado con el producto.
Doble.
CALIFICACIÓN
DEFINITIVA
Calificación de riesgo. Letra que identifica la calificación final de riesgo
del cliente (riesgo de incumplimiento):
• A: Normal.
• B: Aceptable.
• C: Apreciables.
• D: Significativo.
• E: Incobrable.
Texto.
NRO
REESTRUCTURACIONES
Contiene el número total de reestructuraciones que ha tenido el cliente,
desde que se le activo el producto hasta la fecha de corte.
Entero largo.
NRO CUOTAS MORA
Contiene el número total de cuotas (mensuales) en las que el cliente
no ha cumplido con sus pagos oportunos.
Entero largo.
NRO FACTURAS
GENERADAS
Contiene el número total de facturas generadas al cliente, desde el
momento de activación del producto hasta la fecha de corte.
Entero largo.
CUPO DISPONIBLE
Indica el monto total disponible del producto en el período de corte
(mensual).
Doble.
VALOR COMPRAS MES
Contiene el monto total de las transacciones realizadas bajo la
modalidad de compra en el mes (fecha de corte).
Doble.
SALDO COMPRAS
Contiene el monto total de saldo del producto por concepto de
compras.
Doble.
VALOR AVANCES MES
Contiene el monto total de las transacciones realizadas bajo la
modalidad de avance en el mes (fecha de corte).
Doble.
PAGO MÍNIMO
Indica el pago que el cliente debe realizar a la fecha de corte, por las
utilizaciones del mes.
Doble.
PAGO TOTAL
Indica el monto total a pagar. Es la suma del monto total de las
transacciones realizadas por el cliente hasta la fecha de corte.
Doble.
Indica el monto total generado por intereses en el mes analizado.
Doble.
Indica el monto total generado por interés de mora en el mes
analizado.
Doble.
INTERÉS FACTURADO
MES
MORA FACTURADA MES
Tabla 6. Diccionario de datos de la base inicial de tarjetas de crédito vigentes a julio de 2011.
Fuente: La autora.
52
Finalmente, la tabla 7 contiene la descripción de la información demográfica de los clientes que han
presentado transacciones declinadas por fondos insuficientes.
NOMBRE
NRO. DE
IDENTIFICACIÓN
DESCRIPCIÓN DEL CAMPO
TIPO DE
VARIABLE
Número de que identifica al cliente.
Texto.
EDAD
Indica la edad del cliente en años. Número entre 16 y 99.
Texto.
SEXO
Indica el género del cliente.
• F: Femenino.
• M: Masculino.
• E: Empresas.
• 0: No posee información.
Texto.
Indica la actividad a la que se dedica el cliente la mayor parte de su
tiempo.
• A: Ama de casa.
• D: Servidor público.
• E: Empleado.
•
I: Independiente.
• P: Pensionado.
• R: Religioso.
• S: Socio.
• T: Estudiante
• SI: Empresas y sin información.
Texto.
Estado civil del cliente.
• 0: Sin información.
• 1: Soltero.
• 2: Casado.
• 3: Separado.
• 4: Viudo.
• 5: Divorciado.
• 6: Unión libre.
• 7: Religioso.
• SI: Empresas.
Texto.
OCUPACIÓN
ESTADO CÍVIL
Tabla 7. Diccionario de datos de la base demográfica del cliente.
Fuente: La autora.
Una vez se consolidó la base de datos con la información de las transacciones declinadas por fondos
insuficientes, las tarjetas de crédito vigentes a la fecha de corte y los datos demográficos, se procedió a
realizar la limpieza y codificación de las base de datos, con el fin de identificar patrones potenciales que
permitan describir el comportamiento de los clientes a los que se les ha declinado alguna transacción por
fondos insuficientes, teniendo en cuenta los siguientes parámetros:
53
1. La base original codificaba los números de tarjeta de crédito con 19 dígitos. El número de las tarjetas
de crédito debe contener 16 dígitos9. Para codificar la nueva base se debieron eliminar los tres
primeros “0” de cada una de las identificaciones de las tarjetas de crédito.
2. El campo “RED LOGICA ALMACEN” identifica la red por la cual las transacciones han sido
registradas. Para facilitar el manejo de esta información se codificó el campo de la siguiente manera:
11: Visa Internacional, 12: MasterCard Internacional, 13: Diners Internacional, 21: Visa Nacional, 22:
MasterCard Nacional, 23: Diners Nacional.
3. Para simplificar la información relacionada con el almacén donde se registró la declinación de la
transacción, se cruzó la base de datos por nombre y código del establecimiento con una base única
de códigos de establecimientos agrupados, conocida como MCC10. Es importante destacar que del
total de las transacciones declinadas por fondos insuficientes, 217.317 transacciones no cuentan con
información del establecimiento, esto implica que la base final tan sólo cuenta con el 80% de la
información de los MCC.
4. Con respecto a la hora en la que se registró la declinación, se codificó la información de la siguiente
manera: M: Mañana. Horario comprendido entre las 6:00 y las 12:00, T: Tarde. Horario comprendido
entre las 13:00 y las 18:00, N: Noche. Horario comprendido entre las 19:00 y las 5:00.
5. La fecha de declinación de la transacción fue codificada en dos grupos diferentes: (i) Día de la
semana y (ii) Mes. Con respecto al día de la semana, se obtuvo el día en que se realizó la
transacción: 1: Domingo, 2: Lunes, 3: Martes, 4: Miércoles, 5: Jueves, 6: Viernes, 7: Sábado. Con
respecto al mes, se obtuvo el mes en el que se realizó la transacción: 1: Enero, 2: Febrero, 3: Marzo,
4: Abril, 5: Mayo, 6: Junio, 7: Julio, 8: Agosto, 9: Septiembre, 10: Octubre, 11: Noviembre, 12:
Diciembre.
6. El monto de la declinación se dividió entre 1.000 para obtener los valores adecuados de las
transacciones declinadas por fondos insuficientes11.
7. Los campos TIPO TRX, DISPOSITIVO, CÓDIGO DE RECHAZO y POS ENTRY MODE no se
tuvieron en cuenta, ya que se consideró que no eran relevantes para describir el proceso de
valoración y otorgamiento de extra cupos.
8. La información relacionada con avances no se incluye en el análisis, ya que en la base de datos de
declinaciones sólo se cuenta con información de transacciones realizadas bajo la modalidad de
compra.
9. De la base de tarjetas de crédito vigentes a julio de 2011 las variables: TIPO DE IDENTIFICACIÓN,
TIPO DE TARJETA, VALOR 1ª COMPRA, FECHA 1ª AVANCE, VALOR 1ª AVANCE, NRO
Esto con el fin de estandarizar las bases originales para poder realizar cruces a través de este campo.
La descripción de la base total de los MCC se encuentra disponible en el Anexo D del presente trabajo de grado.
11 Las bases de datos presentan variabilidad en la codificación de la información. Esto se debe principalmente a la forma
como se busca y descarga la información del almacén de datos (consultas) y la constitución de las bases de datos en
archivos de Microsoft Excel y/o Microsoft Access.
9
10
54
REESTRUCTURACIONES, NRO CUOTAS MORA, SALDO COMPRAS, VALOR AVANCES MES, no
se tuvieron en cuenta ya que se consideró que no eran relevantes para describir el proceso de
valoración y otorgamiento de extra cupos.
10. Se hizo el cálculo de la diferencia la fecha de corte y la fecha de la última transacción para identificar
los clientes con transacciones más recientes.
11. Se calculó la suma total de los intereses generado por el cliente (corrientes y mora) y se dividió en el
total de años que el cliente tiene su tarjeta de crédito con el Banco, con el fin de identificar el total de
intereses anuales generados.
12. Se calculó la relación entre el valor declinado y el cupo total asignado en todas las tarjetas de crédito
del cliente.
13. Se agruparon las edades en siete grupos: (i) edades entre 16 y 18, (ii) edades entre 19 y 25, (iii)
edades entre 26 y 35, (iv) edades entre 36 y 55, (v) edades entre 56 y 70, (vi) edades entre mayores
de 70 años, y (vii) Sin información y empresas.
14. Las bases de datos disponibles fueron agrupadas por cliente. Se eliminaron las identificaciones de
los clientes y de las tarjetas de crédito, y se reemplazó está información con una identificación
aleatoria (números entre 1 y 195.018)12.
4.3.
VARIABLES INICIALES
Después de haber limpiado y codificado las bases de datos iniciales, se obtuvo la agrupación de los datos con
los campos anteriormente mencionados. En primera medida, se obtuvo una base agrupada por cliente,
compuesta por un total de 195.018 clientes; adicionalmente una base de datos agrupada por MCC, con un
total de 112 establecimientos; una base de datos con información del producto de tarjeta de crédito, con un
total de 259.876 tarjetas de crédito (agrupada en los 195.018 clientes) y una base con la demografía y
segmentación de los clientes a los que les fueron declinadas sus transacciones por fondos insuficientes. A
continuación se presenta la estructura de cada una de las bases obtenidas.
•
Base agrupada por cliente
La base agrupada por cliente cuenta con los siguientes campos.
La no identificación de las bases de datos, tanto de números de identificación de los clientes como de números de
tarjetas de crédito de los mismos, se hizo necesaria para el manejo de la confidencialidad de la información suministrada
por el Banco Davivienda S.A.
12
55
NOMBRE
CLIENTE
TIPO IDENTIFICACIÓN
CALIFICACIÓN
NRO. DE TRANSACCIONES
DECLINADAS
TOTAL DECLINADO
% EXTRA CUPO
FRANQUICIA MÁS FRECUENTE
DESCRIPCIÓN DEL CAMPO
Número que identifica al cliente. Aleatorio entre 1 y 195.018.
Indica el tipo de identificación del cliente
Indica la calificación final de riesgo de cada cliente. (A, B, C, D, E).
Total de transacciones por cliente, declinadas por fondos insuficientes en el
período comprendido entre junio de 2010 y junio de 2011.
Suma del monto de todas las transacciones declinadas del cliente.
Porcentaje del extra cupo declinado. Relación entre el monto declinado el cupo
total asignado.
Moda de la franquicia.
%VISA NAL
Porcentaje de transacciones registradas a través de la red Credibanco Visa.
%VISA INTERNAL
Porcentaje de transacciones registradas a través de la red Visa Internacional.
%MASTER NAL
Porcentaje de transacciones registradas a través de Redeban Multicolor.
%DINERS NAL
Porcentaje de transacciones registradas a través de la red MasterCard
Internacional.
Porcentaje de transacciones registradas a través de la red Diners Nacional.
% DINERS INTERNAL
Porcentaje de transacciones registradas a través de la red Diners Internacional.
%MASTER INTERNAL
TIPO DE TRX MÁS FRECUENTE
% NAL
%INTERNAL
HORA FRECUENTE
Moda de transacción.
Porcentaje de transacciones nacionales.
Porcentaje de transacciones internacionales.
Moda de hora.
%M
Porcentaje de transacciones realizadas en la mañana.
%T
Porcentaje de transacciones realizadas en la tarde.
%N
Porcentaje de transacciones realizadas en la noche.
DÍA FRECUENTE
%DOMINGO
Moda de día.
Porcentaje de transacciones realizadas el domingo.
%LUNES
Porcentaje de transacciones realizadas el lunes.
%MARTES
Porcentaje de transacciones realizadas el martes.
%MIÉRCOLES
Porcentaje de transacciones realizadas el miércoles.
%JUEVES
Porcentaje de transacciones realizadas el jueves.
%VIERNES
Porcentaje de transacciones realizadas el viernes.
%SÁBADO
Porcentaje de transacciones realizadas el sábado.
MES FRECUENTE
Moda de mes.
56
%ENERO
Porcentaje de transacciones realizadas en enero.
%FEBRERO
Porcentaje de transacciones realizadas en febrero.
$MARZO
Porcentaje de transacciones realizadas en marzo.
%ABRIL
Porcentaje de transacciones realizadas en abril.
%MAYO
Porcentaje de transacciones realizadas en mayo.
%JUNIO
Porcentaje de transacciones realizadas en junio.
%JULIO
Porcentaje de transacciones realizadas en julio.
Porcentaje de transacciones realizadas en agosto.
%AGOSTO
%SEPTIEMBRE
Porcentaje de transacciones realizadas en septiembre.
Porcentaje de transacciones realizadas en octubre.
%OCTUBRE
%NOVIEMBRE
Porcentaje de transacciones realizadas en noviembre.
%DICIEMBRE
Porcentaje de transacciones realizadas en diciembre.
MONTO PROMEDIO
Promedio del total declinado por fondos insuficientes.
MONTO MÁXIMO
Monto máximo registrado por cliente.
MONTO MÍNIMO
Monto mínimo registrado por cliente.
DESVIACIÓN ESTÁNDAR MONTO
Desviación estándar de los montos registrados por cliente.
VARIANZA MONTO
Varianza de los montos registrados por cliente.
MCC FRECUENTE
Moda del establecimiento.
Tabla 8. Diccionario de datos de la base agrupada por cliente.
Fuente: La autora.
•
Base agrupada por MCC
La base agrupada por MCC cuenta con los siguientes campos.
NOMBRE
MCC
NRO. DE TRANSACCIONES
DECLINADAS
TOTAL DECLINADO
FRANQUICIA MÁS FRECUENTE
DESCRIPCIÓN DEL CAMPO
Código de MCC.
Total de transacciones por cliente, declinadas por fondos insuficientes en el
período comprendido entre junio de 2010 y junio de 2011.
Suma del monto de todas las transacciones declinadas por MCC.
Moda de la franquicia.
57
%VISA NAL
Porcentaje de transacciones registradas a través de la red Credibanco Visa.
%VISA INTERNAL
Porcentaje de transacciones registradas a través de la red Visa Internacional.
%MASTER NAL
%MASTER INTERNAL
%DINERS NAL
% DINERS INTERNAL
TIPO DE TRX MÁS FRECUENTE
% NAL
%INTERNAL
HORA FRECUENTE
Porcentaje de transacciones registradas a través de Redeban Multicolor.
Porcentaje de transacciones registradas a través de la red MasterCard
Internacional.
Porcentaje de transacciones registradas a través de la red Diners Nacional.
Porcentaje de transacciones registradas a través de la red Diners Internacional.
Moda de transacción.
Porcentaje de transacciones nacionales.
Porcentaje de transacciones internacionales.
Moda de hora.
%M
Porcentaje de transacciones realizadas en la mañana.
%T
Porcentaje de transacciones realizadas en la tarde.
%N
Porcentaje de transacciones realizadas en la noche.
DÍA FRECUENTE
%DOMINGO
Moda de día.
Porcentaje de transacciones realizadas el domingo.
%LUNES
Porcentaje de transacciones realizadas el lunes.
%MARTES
Porcentaje de transacciones realizadas el martes.
%MIÉRCOLES
Porcentaje de transacciones realizadas el miércoles.
%JUEVES
Porcentaje de transacciones realizadas el jueves.
%VIERNES
Porcentaje de transacciones realizadas el viernes.
%SÁBADO
Porcentaje de transacciones realizadas el sábado.
MES FRECUENTE
Moda de mes.
%ENERO
Porcentaje de transacciones realizadas en enero.
%FEBRERO
Porcentaje de transacciones realizadas en febrero.
$MARZO
Porcentaje de transacciones realizadas en marzo.
%ABRIL
Porcentaje de transacciones realizadas en abril.
%MAYO
Porcentaje de transacciones realizadas en mayo.
%JUNIO
Porcentaje de transacciones realizadas en junio.
58
Porcentaje de transacciones realizadas en julio.
%JULIO
Porcentaje de transacciones realizadas en agosto.
%AGOSTO
Porcentaje de transacciones realizadas en septiembre.
%SEPTIEMBRE
Porcentaje de transacciones realizadas en octubre.
%OCTUBRE
%NOVIEMBRE
Porcentaje de transacciones realizadas en noviembre.
%DICIEMBRE
Porcentaje de transacciones realizadas en diciembre.
MONTO PROMEDIO
Promedio del total declinado por fondos insuficientes.
MONTO MÁXIMO
Monto máximo registrado por MCC.
MONTO MÍNIMO
Monto mínimo registrado por MCC.
DESVIACIÓN ESTÁNDAR MONTO
VARIANZA MONTO
Desviación estándar de los montos registrados por MCC.
Varianza de los montos registrados por MCC.
Tabla 9. Diccionario de datos de la base agrupada por MCC.
Fuente: La autora.
•
Base con información del producto de tarjeta de crédito por cliente.
La base agrupada por tarjeta de crédito cuenta con los siguientes campos.
NOMBRE
CLIENTE
DESCRIPCIÓN DEL CAMPO
Número que identifica al cliente. Aleatorio entre 1 y 195.018.
EDAD DEL PRODUCTO
Edad del cliente con el producto de tarjeta de crédito. Indica la edad de la tarjeta
más antigua (en el caso de tener varias tarjetas).
RECENCY
Diferencia entre la última fecha de transacción y la fecha de corte. Indica las
transacciones más recientes.
ANTIQUITY
Total de facturas mensuales generadas por el cliente en todas sus tarjetas de
crédito (Máximo valor).
MONETIZE
Cociente entre la suma de los intereses generados entre el número total de
facturas generadas.
Tabla 10. Diccionario de datos de la base agrupada por tarjeta de crédito.
Fuente: La autora.
Finalmente la base demográfica no tuvo ninguna modificación, pues todos sus campos están compuestos por
variables nominales.
59
4.4.
VARIABLES SELECCIONADAS
Una vez se consolidaron las bases de datos con la información relevante del proceso, se procedió a realizar el
análisis estadístico de cada una de las variables iniciales. Este análisis permitió determinar qué variables eran
relevantes para incluir en el modelo final, de acuerdo con su comportamiento estadístico. Todo el estudio
estadístico se realizó con la ayuda del software PASW 18.0.
El análisis consistió en examinar por separado cada una de las bases de datos iniciales con sus respectivas
variables, con el fin de aplicar las herramientas necesarias para preparar y reducir de manera apropiada los
datos y las variables encontradas, que posteriormente se introducirán en el modelo de Minería de Datos.
El procedimiento que se llevó a cabo se ilustra a continuación en el gráfico 14.
Gráfico 14. Proceso para la selección de variables iniciales.13
Fuente: La autora
Los resultados que arrojó el proceso se listan a continuación.
•
Análisis previo de los datos: De las bases originales, cada una con 195.018 clientes, se
identificó que se presentaban algunos datos sin información en las variables: MCC, género
ocupación y estado civil, sin embargo se caracterizaron dentro de una categoría y se consideró
13
En los anexos E al G del presente documento se encuentra disponible el proceso para la selección de las variables
iniciales. El anexo E comprende el análisis previo de los datos, el anexo F describe el proceso de transformación de las
variables y el anexo G presenta el análisis factorial.
60
que no son críticas para el análisis de clúster. Con respecto a los casos atípicos, la base final
agrupada por cliente presenta 1.508 casos anómalos, lo que corresponde a menos del uno por
ciento de la base total. La base con información RAM, después del análisis previo de los datos,
presentó 9.571 casos anómalos, lo que representa el cinco por ciento de la base total. Las bases
con variables nominales no presentaron ningún caso anómalo.
Adicionalmente, revisando los supuestos del análisis multivariante (normalidad, linealidad y
homocedasticidad) en cada una de las bases disponibles, se encontró que:
1. La base final agrupada por cliente, con 38 variables disponibles, presenta un
comportamiento leptocúrtico en el 89,47% de sus variables y un comportamiento platicúrtico
en el 10,53% de sus variables; con respecto a la simetría de las distribuciones, presenta
asimetría positiva en el 92,10% de sus variables y asimetría negativa en el 7,9%.
2. La base con información del producto de tarjeta de crédito por cliente, con tres variables
disponibles, presenta un comportamiento leptocúrtico en dos de sus variables y un
comportamiento platicúrtico en una variable; con respecto a la simetría de las distribuciones,
presenta asimetría positiva en sus tres variables.
3. Las variables nominales presentan la siguiente distribución porcentual: (i) Calificación: A
(89,2%), B (6,2%), C (2,1%), D (1,8%) y E (0,7%); (ii) MCC: supermercados / tiendas
express (19,2%), almacenes por departamento con supermercado (12,8%), almacenes de
calzado (9,3%), almacenes de vestuario y accesorios para toda la famila (7,1%), estaciones
de servicio, aerolineas (5,65); (iii) Edad: 16-18 (0%), 19-25 (6,4%), 25-35 (30,1%), 36-55
(50%), 56-70 (11,9%), >70 (1,3%) y empresas (0,3%); (iv) Género: femenino (50,7%),
masculino (49 %) y empresas (0,3%); (v) Estado civil: sin información (8,65), soltero (34%),
casado (37,2%), separado (3,2%), viudo (1,5%), divorciado (1,6%), unión libre (13,6%),
religioso (0%) y empesas (0,3%); (vi) Ocupación: ama de casa (0,9%), servidor público
(0,1%), empleado (64,8%), independiente (26%), pensionado (2,7%), religioso (0%), socio
(0,2%), empresas y sin información (4,6%), estudiante (0,7%).
•
Transformación de las variables iniciales: Dados estos comportamientos se hace necesario
transformar las variables con el fin de disminuir la curtosis y la asimetría de las variables
escalares. Como la mayoría de las variables presentaban un comportamiento leptocúrtico y
asimétrico positivo, se llevó a cabo la transformación de logaritmo en base 10 [log( + 1)] de
cada una de las variables. Se obtuvo los siguientes resultados:
1. La base final agrupada por cliente, presenta después de la transformación una disminución
significativa en los valores de las curtosis y las asimetrías de todas sus variables. Los
comportamientos leptocúrticos se presentan en el 36,84% de sus variables y los
comportamientos platicúrticos se presentan en el 63,16% de sus variables. Lo anterior
61
implica que hubo una variación de 52,63 puntos porcentuales; con respecto a la simetría de
las distribuciones, ahora presenta asimetría positiva en el 63,15% de sus variables y
asimetría negativa en el 36,85%, lo que implica una variación de 28,95 puntos porcentuales.
Lo anterior es un buen indicador ya que asegura que las variables no tienen valores
extremos y se facilita el análisis de los conglomerados.
2. La base con información del producto de tarjeta de crédito por cliente después de la
transformación no presenta comportamiento leptocúrtico en ninguna de sus variables, es
decir, ahora todas sus variables presentan un comportamiento platicúrtico; con respecto a la
simetría de las distribuciones, presenta asimetría positiva en sus tres variables.
3. Las variables nominales no fueron transformadas.
Una vez se han transformado las variables se procede a estandarizarlas para asegurar que los
valores incluidos en cada una de éstas están siendo homogéneos, es decir, se está removiendo la
escala de cada una de las variables.
1. Análisis factorial: Se realizó el análisis factorial por componentes principales. Se pudo concluir que
aunque no fue posible una gran reducción de variables a factores, dado que el grafico de
sedimentación resultante sugería doce factores, sí fue posible eliminar del análisis las variables:
Monto Total Declinado, Monto Mínimo, Monto Máximo, % Visa Internacional y % Master
Internacional, y las variables que podían generar redundancia y multicolinealidad: % Diners Nacional,
% Diners Internacional, % Transacciones Internacionales, % Noche, % Domingo, y % Enero. Al final
se seleccionaron 26 variables escalares y seis variables nominales. Las tres variables RAM fueron
incluidas en su totalidad.
4.4.1.
Criterios para la selección de variables
Una vez finalizado este proceso se procedió a seleccionar las variables que se ingresarían en el mecanismo
de Minería de Datos para analizar el proceso de valoración y otorgamiento de extra cupos. Los criterios que
se tuvieron en cuenta se listan a continuación.
1. Seleccionar la base de datos que contiene mayor información y describe de mejor manera el proceso
de declinación de transacciones por fondos insuficientes. De acuerdo con esto se determinó que la
base agrupada por MCC no se tendría en cuenta, ya que en la base agrupada por cliente se tiene un
campo con la información cliente a cliente del establecimiento más frecuente de transacción.
2. Elegir las variables que realmente describen el proceso de valoración y otorgamiento de extra cupos.
De la base agrupada por cliente se descartaron las variables que describían las frecuencias: (i) de
62
las franquicias (Franquicia más frecuente); (ii) de las horas (Hora más frecuente); (iii) de los días (Día
más frecuente) y (iii) de los meses (Mes más frecuente). Se eliminaron estas variables ya que se
encontró que en el proceso de codificación se había calculado la moda de las variables asociadas a
éstas y se presentaban múltiples modas para un mismo cliente, por lo que se consideró que no
correspondía de manera adecuada a lo que se quería describir en la variable.
3. Seleccionar las variables que después del análisis previo y la transformación inicial contienen la
mayor información del total de las variables disponibles. Esto implica que se seleccionan las
variables que representan de mejor manera la información contenida en otras variables. Para llevar a
cabo este proceso se tiene en cuenta la matriz de correlaciones de los factores rotados del Análisis
Factorial. Las variables de la base de datos agrupada por cliente que se eliminaron del análisis
fueron: (i) Las que representan el monto total declinado: Total Declinado ($), Monto Mínimo, Monto
Máximo, pues están representadas por las variables: Número de transacciones declinadas,
Promedio de declinación ($) y Desviación estándar ($) y (ii) Las que representan transacciones
internacionales: % Visa Internacional, % Master Internacional y % Diners Internacional, pues están
representadas por las transacciones que se hacen a nivel nacional.
4. Seleccionar variables que además de describir el proceso de valoración y otorgamiento de extra
cupos, puedan describir el comportamiento del cliente con su producto de tarjeta de crédito en el
tiempo, así como las variables que describen la demografía del cliente.
En conclusión se identificaron tres grupos de variables que describen al cliente:
•
Variables de comportamiento: Describen el comportamiento de los clientes que han registrado alguna
transacción declinada por fondos insuficientes.
•
Variables de fidelidad con la entidad14: Teniendo en cuenta la idea de que “El 80% del negocio
proviene del 20% de los clientes”, se encontraron las variables que describen la novedad de las
transacciones, ¿qué tan recientes son las transacciones del cliente?, la antigüedad del cliente, ¿cuánto
lleva el cliente con el Banco? y el beneficio económico asociado a las transacciones, ¿cuánto dinero
genera el cliente con sus transacciones?
•
Variables demográficas: Describen las características más generales de los clientes.
14
Esta agrupación hace referencia al análisis RFM.
63
5.
MECANISMO DE MINERÍA DE DATOS
El siguiente paso en el análisis de la información disponible es emplear alguna herramienta de Minería de
Datos para encontrar patrones escondidos, que permitan analizar, identificar y establecer parámetros en el
comportamiento y las características de los clientes a los que se les han declinado sus transacciones por
fondos insuficientes. Lo anterior con el fin de generar un mecanismo eficiente que facilite la toma de
decisiones con respecto a los clientes a los que se les puede otorgar un extra cupo en alguna de sus tarjetas
de crédito. A continuación se presenta la descripción del mecanismo de Minería de Datos empleado, el
proceso llevado a cabo y los resultados obtenidos.
5.1.
SELECCIÓN DEL MÉTODO A EMPLEAR
Se ha identificado que la técnica de Minería de Datos que se va a utilizar para determinar una forma eficiente
de valorar y otorgar extra cupos a los tarjetahabientes del Banco Davivienda S.A. es una técnica de
aprendizaje no supervisado, específicamente un algoritmo de agrupamiento o clustering. No será necesaria la
utilización de técnicas de aprendizaje supervisado, pues no se requiere de la predicción de algún
comportamiento de los tarjetahabientes.
El propósito general es encontrar grupos homogéneos de clientes que presenten características similares de
acuerdo con su comportamiento con el producto de tarjeta de crédito (declinaciones por fondos insuficientes),
su fidelidad con la entidad y su demografía, para posteriormente plantear políticas aplicables al proceso de
valoración y otorgamiento de extra cupos, y permitir que algunos de los clientes a los que se les han
declinado transacciones por fondos insuficientes con anterioridad, puedan acceder al beneficio de obtener
extra cupos ocasionales.
El mecanismo de Minería Datos que se propone, debe analizar al cliente desde la perspectiva de la relación
que éste ha tenido con la entidad, basado en el modelo de gestión planteado por el CRM (por sus siglas en
inglés, Costumer Relationship Management), permitiendo así que la decisión de la autorización transaccional
no sólo se base en la calificación de riesgo y el tipo de producto, sino que también, haga uso de variables que
describen al cliente como usuario de las tarjetas de crédito dentro del Banco Davivienda S.A.
La idea general de la propuesta es que además de revisar el comportamiento crediticio del tarjetahabiente, el
cual es una variable fundamental para comprender al cliente desde la perspectiva de su capacidad de pago,
su probabilidad de incumplir con las obligaciones y el riesgo que genera financieramente a la entidad, se
puedan aplicar términos como CLTV (por sus siglas en inglés, Costumer Lifetime Value) y RFM (por sus
siglas en inglés, Recency, Frequency and Monetary Value), como método de premiación al cliente por su
trayectoria dentro del Banco Davivienda S.A. Es así como la propuesta de Minería de Datos deberá tener en
64
cuenta conceptos como: fidelización y conocimiento del cliente, optimización de la relación con el cliente,
mejoramiento de la imagen de la entidad, entre otros.
5.2.
DESCRIPCIÓN DEL MÉTODO
La técnica de agrupamiento por conglomerados o clustering consiste en segmentar una población
heterogénea en un número de grupos o conglomerados homogéneos. Tiene como objetivo asignar unas
variables o grupo de variables a un grupo homogéneo, asegurándose de que los objetos de un grupo sean
similares entre ellos y se diferencien de los objetos incluidos en otros grupos. Los grupos son desconocidos
en el momento en que se está desarrollando el algoritmo, lo que implica que no existan grupos predefinidos.
El análisis de clúster permite descubrir asociaciones y estructuras en los datos que no son evidentes a priori,
pero que pueden ser útiles en la generación de conocimiento. Los resultados del análisis de conglomerados
contribuyen a: (i) la definición formal de esquemas de clasificación, tal como la taxonomía para un conjunto de
objetos; (ii) la elaboración de modelos estadísticos como herramienta para describir conjuntos de datos; (iii) la
asignación de nuevos individuos a las clases, para el diagnóstico e identificación de patrones, y (iv) muchas
otras aplicaciones en Minería de Datos (Carbonell Asíns, 2011).
“Se utiliza clustering cuando se desea aprovechar la información relativa a un conjunto de variables para
clasificar a un grupo amplio de sujetos y objetos en subgrupos de máxima homogeneidad intergrupal y
mayor heterogeneidad entre grupal. El análisis clúster no debe confundirse con el discriminante, ya que
este último tiene por objeto explicar una clasificación establecida a priori mientras que el análisis clúster
intenta, precisamente, generar esa clasificación a partir de un único grupo global”. (Curso de Introducción
y Manejo Básico del SPSS).
Existen dos métodos de clasificación de los conglomerados: (i) los métodos de clasificación jerárquicos y (ii)
los métodos de clasificación no jerárquicos. En los métodos jerárquicos, la clasificación final tiene un número
de grupos anidados, mientras que en los métodos no jerárquicos, no se presentan grupos finales anidados.
Igualmente existen dos técnicas relacionadas a estos métodos de clasificación: (i) las acumulativas y (ii) las
divisivas. En las técnicas acumulativas el punto de partida son las clases de objetos disponibles que se
desean clasificar a medida que se va iterando, con el fin de agrupar las variables en clases de objetos con
características similares. En las técnicas divisivas el punto de partida es la única clase formada por todas las
variables y a medida que se va iterando, se van dividiendo los objetos en clases más pequeñas (Vicente
Villardón).
El proceso que se sigue consiste en analizar cinco pasos fundamentales. El primer paso es establecer qué
datos o variables se van a tener en cuenta en cada uno de los casos. Esto implica que se deben analizar las
variables que se van a incluir en el grupo, de acuerdo con los tipos de variables disponibles: escalares,
categóricas o nominales. El segundo paso es elegir una medida de distancia entre los objetos a clasificar, los
cuales serán los grupos o conglomerados iniciales. En este paso, el método más común para calcular la
distancia entre los objetos es el Método de Ward, el cual consiste en agrupar las variables de acuerdo con la
varianza que presentan conjuntamente. Igualmente es recomendable estandarizar las variables iniciales con
65
el fin de asegurar que todas están siendo medidas bajo parámetros homogéneos. El tercer paso consiste en
ejecutar la agrupación con la ayuda de algún software estadístico y examinar los conglomerados que
presenten características similares. El cuarto paso es eliminar los grupos que presenten características
similares juntándolos en un nuevo grupo, se debe asegurar que cada grupo contenga más de dos elementos.
El quinto paso sugiere que se recalculen las distancias entre los grupos hallados y repetir el procedimiento
hasta que se tenga una solución clara que se adapte al propósito general del agrupamiento (Carbonell Asíns,
2011)
En el gráfico 15 se ilustra el proceso anteriormente descrito.
Gráfico 15. Proceso de análisis de conglomerados.
Fuente: La autora
Los algoritmos dependen del método utilizado para calcular la distancia entre grupos. El agrupamiento por
conglomerados consiste en la iteración de reglas con el fin de optimizar la solución final, lo que implica que no
exista una única clasificación correcta, es decir, diferentes métodos para el cálculo de las distancias entre
grupos homogéneos, tienen como resultado diferentes agrupaciones. Por lo tanto, es importante analizar la
matriz de distancias, tratando de minimizar las distancias entre elementos de un mismo grupo y maximizar las
distancias entre grupos.
Finalmente, para analizar los grupos obtenidos se cuenta con herramientas de visualización de los resultados
tales como la matriz de distancias. Con ayuda de un software estadístico se puede obtener esta matriz de
66
resultados finales. Se debe analizar cada uno de los grupos encontrados con el fin de generar parámetros y
políticas de interés al caso de estudio.
5.3.
DESARROLLO DEL MODELO
El desarrollo del modelo de agrupamiento por conglomerados para el presente trabajo de grado estuvo
dividido en tres enfoques fundamentales: (i) el clúster para determinar comportamientos en los clientes que
han presentado transacciones declinadas por fondos insuficientes, (ii) el clúster basado en RAM (por sus
siglas en inglés, Recency, Antiquity, Monetize)15 para determinar grupos de clientes que aunque han
presentado transacciones declinadas por fondos insuficientes, presentan un comportamiento reciente, tienen
antigüedad con la entidad y generan valores monetarios interesantes en la utilización de sus tarjetas de
crédito16 y (iii) la demografía de los clientes.
Adicionalmente, se tuvo en cuenta las calificaciones de crédito y los MCC más frecuentes, para hacer un
análisis más completo de las posibles políticas que pueden surgir para optimizar el proceso de valoración y
otorgamiento de extra cupos dentro del Banco Davivienda S.A.
Cabe destacar que el agrupamiento por conglomerados para cada uno de los enfoques fue desarrollado con
la ayuda del software PASW 18.0. La técnica multivariante elegida fue el análisis de conglomerados de K
medias, ya que permite mayor flexibilidad en algunos de los supuestos estadísticos (linealidad, normalidad,
variables categóricas, etc.) y admite varios métodos de estimación de la matriz de distancias. Igualmente, a
través de ésta se tiene la posibilidad de procesar un número ilimitado de casos, aunque sólo permita utilizar
un método de aglomeración y requiera previamente el número de conglomerados que se desea obtener
(Universidad Complutense de Madrid).
5.3.1.
Definición de parámetros
Hay dos tipos de parámetros que se deben tener en cuenta para desarrollar el modelo: (i) parámetros para la
realización del modelo y (ii) parámetros para la caracterización de los clientes. A continuación se presenta la
descripción de cada uno.
•
Parámetros para la realización del modelo
RAM (Recency, Antiquity, Monetize) hace referencia a la adaptación, por parte de la autora, de la teoría del RFM
(Recency, Frequency, Monetize) a la disponibilidad de la información del presente trabajo de grado. No se contó con
información que contribuyera a calcular la frecuencia de las transacciones, por lo cual se decidió cambiar este parámetro
por la antigüedad del cliente, ya que se considera una característica relevante de para determinar la fidelidad.
16 Teniendo en cuenta solamente los intereses generados por cada cliente en el tiempo.
15
67
Para el desarrollo del análisis de los conglomerados se tuvo en cuenta las siguientes condiciones:
1. Número de grupos: En primera medida es importante determinar cuántos grupos se quieren y se
desean encontrar. Con respecto a esto se determinó que el número óptimo de grupos debía ser
alrededor de diez, ya que se esperaba que éstos fueran suficientes para describir adecuadamente
los comportamientos más relevantes de los tarjetahabientes. Sin embargo, se hizo el análisis de
conglomerados de K medias para los casos entre cinco y quince grupos predeterminados, y se
concluyó que el número adecuado de grupos era ocho. Esta decisión estuvo basada en tres criterios
principales: (i) el número de grupos no presente un crecimiento desproporcionado al combinarlo con
las variables RAM y las variables demográficas, (ii) al analizar cualitativamente el significado de los
grupos, se encontró que la solución de ocho conglomerados permitía identificar grupos de clientes
interesantes para el negocio, con soluciones similares a las encontradas con mayor cantidad de
grupos, y (iii) basado en el análisis de varianza se determina sí existe diferencia significativa entre el
número de conglomerados y la distancia entre cada caso al centro del clúster.17
2. Número máximo de iteraciones: Se determinó que el límite de iteraciones fuera 100, con el fin de
asegurar que transcurridas todas las iteraciones se consiguiera la convergencia.
3. Criterio de convergencia: Representa la proporción de la distancia mínima existente entre los
centros iniciales de los conglomerados. Se estipuló que el valor de convergencia debía ser del 0%.
Lo anterior permite asegurar que en la última iteración del algoritmo de agrupamiento por
conglomerado de K medias, todos los centros se han desplazado lo suficiente como para asegurar
que ninguna de las distancias entre ellos es mayor al 0%, es decir, todos han convergido
(Universidad Complutense de Madrid).
4. Conglomerado de pertenencia: El conglomerado de pertenencia indica el grupo al que pertenece
un determinado cliente (Ibídem, p. 67). Se guardan estos valores en una nueva variable (qcl_1)18
para permitir análisis posteriores.
5. Distancia desde el centro del conglomerado: La distancia desde el centro del conglomerado
corresponde a la distancia euclídea existente entre cada caso y el centro del conglomerado al que
pertenece (Ibídem, p. 67). Igualmente, se guardan estos valores en una nueva variable (qcl_2) para
permitir análisis posteriores.
6. Tabla de contingencia: Una vez identificados los conglomerados, se agrupan cada una de las
variables nominales disponibles en alguno de éstos con el fin de identificar la distribución de estas
características en cada uno de los grupos analizados. Se obtiene la tabla con los recuentos por cada
grupo y cada variable, y los residuos tipificados.
En el Anexo H está disponible el análisis de varianza ANOVA de un factor que se llevo a cabo para la selección del
número de grupos escogidos.
18 La numeración de las variables “qcl_#” va aumentando de acuerdo con el número de análisis de conglomerados de K
medias que se ejecuten. Para un solo análisis se crearán dos variables: qcl_1 y qcl_2, correspondientes al conglomerado
de pertenencia y la distancia desde el centro del conglomerado, respectivamente.
17
68
Una vez determinadas las condiciones, se procede a realizar el agrupamiento por conglomerados de K
medias con la ayuda del software PASW 18.0. Los resultados a analizar son: los centros de conglomerados
finales, el número de casos en cada conglomerado y los residuos tipificados de cada una de las tablas de
contingencia.
•
Parámetros para la caracterización de los clientes
Para caracterizar los patrones encontrados a través de los conglomerados se deben considerar los siguientes
parámetros:
1. En la tabla de los centros finales por conglomerado, se buscan las variables que tengan mayores
valores por grupo, y los grupos que tengan mayores valores por variable. Lo anterior implica que el
análisis se debe centrar en encontrar los valores absolutos máximos, tanto por filas como por
columnas. Estos valores indican los comportamientos sobresalientes por variables y por grupos. Sí el
valor más alto encontrado por conglomerado es negativo, indica que esa variable no es preferente
para ese grupo, e igualmente, sí el valor más alto encontrado por conglomerado es positivo, indica la
preferencia de esa variable en el grupo.
2. Las tablas de casos por conglomerados dan una idea de la distribución de la población en cada uno
de los grupos encontrados.
3. Las tablas de contingencia indican el comportamiento de la variable nominal con respecto a cada
uno de los grupos encontrados. Se deben tener en cuenta los residuos tipificados de cada variable
en cada conglomerado. Se buscan los valores más altos, positivos o negativos, y se comparan
contra el valor |5,00|, para determinar la relevancia de cada una de las variables en cada uno de los
grupos.
4. Se debe tener en cuenta que en la variable “Recency” el calificativo B indica que las transacciones
han sido recientes, y el calificativo A que las transacciones no han sido recientes. Igualmente, para
las variables “Antiquity” y “Monetize” los calificativos B indican antigüedad baja (cliente nuevo) y
montos bajos, respectivamente, y los calificativos A indican mayor antigüedad y montos altos,
respectivamente.
5.4.
CARACTERIZACIÓN DE LOS CLIENTES
A continuación se describe el desarrollo del agrupamiento por conglomerado de acuerdo con los dos
enfoques propuestos19.
En el anexo H se encuentran disponibles la tabla con los centros finales de los conglomerados y las tablas de
contingencia de cada una de las variables estudiadas.
19
69
•
Primer enfoque: Determinar el comportamiento de los clientes que han presentado
transacciones declinadas por fondos insuficientes.
El punto de partida para este enfoque es el conjunto de variables seleccionadas después de haber realizado
el análisis factorial de la base de datos agrupada por cliente.
A continuación se listan los resultados obtenidos.
×
Número de iteraciones ejecutadas y convergencia de los centros finales: Se logró la convergencia en
la iteración número 56. Esto implica que se ha encontrado una solución no trivial y óptima en dicha
iteración.
×
Centros de conglomerados finales: Teniendo como base la tabla de los centros de los
conglomerados finales, se realizó el análisis de éstos y se encontraron las siguientes características.
×
•
Conglomerado 1: Muchas transacciones internacionales, alta variabilidad en los montos
declinados y porcentajes de extra cupos altos.
•
Conglomerado 2: No presenta parámetros relevantes. Se espera que en análisis de
conglomerados de K medias se distinga un grupo que no presente características relevantes. A
este conglomerado se le denomina “molde”, dado que en él están agrupados los clientes que no
presentan comportamientos relevantes dentro de toda la población (Alvarado Valencia, 2011)
•
Conglomerado 3: Transacciones frecuentes en noviembre y no mucho en junio.
•
Conglomerado 4: Transacciones internacionales con porcentaje de extra cupos bajos y de no
preferencia en la tarde.
•
Conglomerado 5: Transacciones frecuentes en marzo, abril, mayo con alta variabilidad en los
motos declinados.
•
Conglomerado 6: Pocas transacciones declinadas y no variabilidad en los montos declinados.
•
Conglomerado 7: Muchas transacciones declinadas, porcentajes de extra cupos altos y alta
variabilidad en los montos declinados.
•
Conglomerado 8: Transacciones internacionales con altos promedios de declinación.
Número de clientes por conglomerado: Con respecto a la distribución de los clientes entre los
conglomerados encontrados se puede afirmar que ninguno de ellos tiene muy pocos clientes (por
ejemplo 10 o 20). Los grupos pequeños tienen una identificación clara de acuerdo a su perfil de
70
conglomerado lo que los hace nichos interesantes de mercado. El gráfico 16 presenta la distribución
de los clientes por conglomerado.
Gráfico 16. Número de clientes por conglomerado.
Fuente: La autora.
Por otro lado, para incluir en el análisis las variables nominales CALIFICACIÓN y MCC se analiza la tabla de
contingencia resultante entre los grupos identificados con anterioridad y cada una de estas variables.
A continuación se listan los resultados obtenidos.
×
Pruebas de chi cuadrado: Las tablas de contingencia resultantes entre los conglomerados iniciales y
la calificación, y entre los conglomerados iniciales y los MCC, fueron significativas al nivel 5%.
×
Tablas de contingencias finales: Teniendo como base las tablas de contingencia, se realizó el
análisis de éstos y se encontraron las siguientes características.
•
Conglomerado 1: Calificación más frecuente: A. Establecimientos comerciales más
frecuentados: aerolíneas, compras en Internet, transporte de carga en general, almacenes de
computadores y software, entidades financieras, hoteles y centros vacacionales, compañías de
alquiler de vehículos y asociaciones profesionales y gremios.
•
Conglomerado 2: Calificación más frecuente: D y E. Establecimientos comerciales más
frecuentados: Contratistas generales, residenciales y comerciales, almacenes por departamento
sin supermercado, almacenes de misceláneas, cacharrerías y artículos para regalo,
supermercados y tiendas exprés, almacén por departamento con supermercado, almacenes de
vestuario y accesorios para toda la familia, droguerías, farmacias, tiendas naturistas, mercadeo
directo, servicios de seguros, mercadeo directo, comerciantes de ventas telefónicas – DIRECTV
y hoteles y centros vacacionales.
71
•
•
Conglomerado 3: Calificación más frecuente: C y D. Establecimientos comerciales más
frecuentados: aerolíneas, almacenes por departamento sin supermercado y supermercados y
tiendas exprés.
•
Conglomerado 4: Calificación más frecuente: A. Establecimientos comerciales más
frecuentados: sin nombre, compras en Internet, almacenes de computadores y software,
entidades financieras, compañías de alquiler de vehículos y asociaciones profesionales y
gremios.
•
Conglomerado 5: Calificación más frecuente: A. Establecimientos comerciales más
frecuentados: venta de equipos y servicios de telecomunicaciones, almacenes por departamento
sin supermercado, supermercados y tiendas exprés, almacén por departamento con
supermercado y estaciones de servicio (venta de gasolina y gas vehicular).
•
Conglomerado 6: Calificación más frecuente: no presenta un parámetro relevante.
Establecimientos comerciales más frecuentados: sin nombre, almacenes de calzado, almacenes
de electrodomésticos y gasodomésticos, librerías, aseguradoras, agencias de boletería
(producciones de teatro) excepto cine, ópticas y artículos ópticos y colegios, universidades,
institutos de educación tecnológica y prescolar.
•
Conglomerado 7: Calificación más frecuente: B. Establecimientos comerciales más
frecuentados: servicios de ambulancia, comprar en Internet, suscripción por cable y otros
servicios de radio y T.V. pagos, supermercados y tiendas exprés, almacén por departamento
con supermercado, estaciones de servicio (venta de gasolina y gas vehicular), almacenes de
vestuario y accesorios para toda la familia, mercadeo directo, servicios de seguros, mercadeo
directo, comerciantes de ventas telefónicas – DIRECTV y casinos, juegos de azar, loterías y
rifas.
•
Conglomerado 8: Calificación más frecuente: A. Establecimientos comerciales más
frecuentados: sin nombre, aerolíneas, compras en Internet, transporte de carga en general,
almacenes de computadores y software, entidades financieras, hoteles y centros vacacionales,
compañías de alquiler de vehículos y asociaciones profesionales y gremios.
Segundo enfoque: Recency, Antiquity and Monetize – RAM
En este enfoque el objetivo es determinar los grupos de clientes con comportamientos similares, a partir de la
novedad de sus transacciones, la antigüedad del tarjetahabiente con la entidad y la ganancia monetaria que
representa el cliente para el Banco.
72
Teniendo en cuenta lo anterior se procedió a generar los grupos de interés para el análisis de los datos
obtenidos. Se desean analizar los grupos de clientes que presentes características “buenas” y “malas” en
cada una de las variables disponibles. Es así como se encuentran los siguientes ocho20 grupos objetivos:
×
×
×
×
×
×
×
×
Primer grupo:
Segundo grupo:
Tercer grupo:
Cuarto grupo:
Quinto grupo:
Sexto grupo:
Séptimo grupo:
Octavo grupo:
Transacciones recientes, clientes antiguos y montos altos.
Transacciones recientes, clientes antiguos y montos bajos.
Transacciones recientes, clientes nuevos y montos altos.
Transacciones recientes, clientes nuevos y montos bajos.
Transacciones antiguas, clientes antiguos y montos altos.
Transacciones antiguas, clientes nuevos y montos bajos.
Transacciones antiguas, clientes antiguos y montos bajos.
Transacciones antiguas, clientes nuevos y montos altos.
El agrupamiento se realizó con respecto a la mediana de cada una de las variables con el fin de asignarle una
calificación a cada cliente, en referencia con este estadístico. Sí los valores están por debajo o son iguales a
la mediana, tienen asignada la calificación “baja”, representada por la letra B; y sí los valores están por
encima de la mediana, tienen asignada la calificación “alta”, representada por la letra A. De esta forma, los
ocho grupos objetivos quedan consolidados de la siguiente manera:
Recency
×
×
×
×
×
×
×
×
Primer grupo:
Segundo grupo:
Tercer grupo:
Cuarto grupo:
Quinto grupo:
Sexto grupo:
Séptimo grupo:
Octavo grupo:
B
B
B
B
A
A
A
A
Antiquity
A
A
B
B
A
B
A
B
Monetize
A
B
A
B
A
B
B
A
Adicionalmente, se procedió a clasificar a cada uno de los clientes dentro de alguno de estos grupos,
obteniendo los siguientes resultados:
GRUPO
BAA
BAB
BBA
BBB
AAA
NÚMERO DE
CASOS
19.819 clientes
30.680 clientes
39.773 clientes
12.335 clientes
12.675 clientes
% TOTAL
10,70%
16,56%
21,47%
6,66%
6,84%
Se dividen las tres variables en dos grupos cada una (altos y bajos). Utilizando la regla de la multiplicación se obtiene
que el número total de grupos de interés es ocho.
20
73
ABB
AAB
ABA
TOTAL
14.157 clientes
25.899 clientes
29.930 clientes
185.268 clientes
7,64%
13,98%
16,15%
100%
Tabla 11. Número y porcentaje de casos por conglomerado RAM.
Fuente: La autora.
El gráfico 17 ilustra el número de clientes en cada uno de los grupos encontrados.
Gráfico 17. Número de clientes por conglomerado RAM.
Fuente: La autora.
Finalmente, para unificar la caracterización de los clientes se procedió a generar las tablas de contingencia
entre los ocho primeros conglomerados y las características. A continuación se presentan los resultados
obtenidos en la tabla de contingencia entre los grupos RAM identificados y los primeros ocho conglomerados.
×
Pruebas de chi cuadrado: La tabla de contingencia resultante entre los conglomerados iniciales y los
grupos RAM fue significativa al nivel 5%.
×
Tablas de contingencias finales: Teniendo como base las tablas de contingencia, se realizó el
análisis de éstos y se encontraron las siguientes características:
•
Conglomerado 1: Grupo RAM más frecuente: BAA y BBA.
•
Conglomerado 2: Grupo RAM más frecuente: BAB.
•
Conglomerado 3: Grupo RAM más frecuente: no presenta un parámetro relevante.
•
Conglomerado 4: Grupo RAM más frecuente: BBA.
•
Conglomerado 5: Grupo RAM más frecuente: ABA y BBA.
74
•
•
Conglomerado 6: Grupo RAM más frecuente: AAB, ABA, ABB, BBB.
•
Conglomerado 7: Grupo RAM más frecuente: AAA, BAA y BAB.
•
Conglomerado 8: Grupo RAM más frecuente: BBB.
Tercer enfoque: Demografía de los clientes
En este enfoque el objetivo es determinar las características demográficas más relevantes en cada uno de los
ocho grupos iniciales. A continuación se listan los resultados obtenidos.
×
Pruebas de chi cuadrado: La tablas de contingencias resultantes entre los conglomerados iniciales y
la demografía del cliente (edad, género, estado civil y ocupación) fueron significativa al nivel 5%.
×
Tablas de contingencias finales: Teniendo como base las tablas de contingencia, se realizó el
análisis de éstos y se encontraron las siguientes características:
•
Conglomerado 1: Género más frecuente: masculino, edad más frecuente: entre 56 y 70 años,
estado civil más frecuente: casado, ocupación más frecuente: independiente.
•
Conglomerado 2: Género más frecuente: femenino, edad más frecuente: entre 36 y 55 años,
estado civil más frecuente: no presenta un parámetro relevante, ocupación más frecuente: no
presenta un parámetro relevante.
•
Conglomerado 3: Género más frecuente: femenino, edad más frecuente: entre 36 y 55 años,
estado civil más frecuente: no presenta un parámetro relevante, ocupación más frecuente: no
presenta un parámetro relevante.
•
Conglomerado 4: Este grupo contiene empresas en su mayoría. Con respecto a las personas
naturales: Género más frecuente: masculino, edad más frecuente: entre 26 y 35 años, estado
civil más frecuente: casado, ocupación más frecuente: independiente.
•
Conglomerado 5: Género más frecuente: no presenta un parámetro relevante, edad más
frecuente: entre 19 y 25 años y entre 26 y 35 años, estado civil más frecuente: soltero,
ocupación más frecuente: independiente.
•
Conglomerado 6: Género más frecuente: femenino, edad más frecuente: entre 19 y 25 años y
entre 26 y 35 años, estado civil más frecuente: unión libre, ocupación más frecuente: empleado.
75
•
Conglomerado 7: Género más frecuente: femenino, edad más frecuente: entre 35 y 55 años y
entre 56 y 70 años, estado civil más frecuente: casado, ocupación más frecuente:
independiente.
•
Conglomerado 8: Este grupo contiene empresas en su mayoría. Con respecto a las personas
naturales: Género más frecuente: masculino, edad más frecuente: entre 26 y 35 años, estado
civil más frecuente: casado, ocupación más frecuente: independiente.
De acuerdo con lo anterior, se pueden nombrar cada uno de los conglomerados de acuerdo con las
características que presenta. La tabla 12 presenta la denominación que se le ha dado a cada uno de los
segmentos de clientes identificados.
NÚMERO DE
CONGLOMERADO
1.
2.
3.
4.
5.
6.
7.
8.
DENOMINACIÓN
CLIENTES EJECUTIVOS - V.I.P.
CLIENTES PROMEDIO.
CLIENTES “NOVEMBRINOS”.
CLIENTES INTERNACIONALES CON ALTOS MONTOS.
CLIENTES SEGUNDO TRIMESTRE DEL AÑO EN
SUPERMERCADOS.
CLIENTES OCASIONALES.
CLIENTES COMPULSIVOS – URGENTES.
CLIENTES INTERNACIONALES CON BAJOS MONTOS.
Tabla 12. Denominación de los conglomerados.
Fuente: La autora.
En resumen, la tabla 13 presenta la descripción de las características más relevantes de los ocho grupos
encontrados, teniendo en cuenta el comportamiento transaccional, la preferencia de establecimientos
comerciales, la calificación de crédito, la clasificación RAM y la demografía (edad, género, estado civil y
ocupación). Esto permite caracterizar a los tarjetahabientes por comportamientos, lo que implica la generación
de estrategias personalizadas.
76
(42.239)
2.
(2.542)
1.
NÚMERO
DE
GRUPO
Gran
cantidad
de
transacciones.
Transacciones
internacionales.
Alta variabilidad en los
montos declinados.
Altos porcentajes de
extra cupo.
No presenta un parámetro
relevante. Clientes con
comportamientos promedio.
•
•
•
•
COMPORTAMIENTO
TRANSACCIONAL
•
•
•
•
•
•
•
•
•
77
Contratistas
generales,
residenciales y comerciales.
Almacenes por departamento sin
supermercado.
Almacenes
de
misceláneas,
cacharrerías y artículos para regalo.
Supermercados y tiendas express.
Almacén por departamento con
supermercado.
Almacenes
de
vestuario
y
accesorios para toda la familia.
Droguerías, farmacias, tiendas
naturistas.
Mercadeo directo, servicios de
seguros.
Mercadeo directo, comerciantes de
ventas telefónicas - DIRECTV.
Hoteles y centros vacacionales.
•
•
•
•
•
Aerolíneas.
Compras en Internet.
Transporte de carga en general.
Almacenes de computadores y
software.
Entidades financieras.
Hoteles y centros vacacionales.
Compañías de alquiler de vehículos.
Asociaciones
profesionales
y
gremios.
•
•
•
•
MCC PREFERENTE
D y E.
A.
CALIF.DE
CRÉDITO
BAA
Transacciones
recientes,
clientes
antiguos y montos altos.
BBA:
Transacciones
recientes, clientes nuevos
y montos altos.
•
BAB:
Transacciones
recientes,
clientes
antiguos y montos bajos.
En general son clientes con
transacciones recientes que
generan montos altos de
utilidad.
•
•
RAM
•
•
•
•
•
•
•
•
Género: Femenino.
Edad: Entre 36 y 55
años.
Estado civil: Sin
parámetro relevante.
Ocupación: Sin
parámetro relevante.
Género: Masculino.
Edad: Entre 56 y 70
años.
Estado civil: Casado.
Ocupación:
Independiente.
DEMOGRAFÍA
(34.145)
5.
(2.868)
•
•
•
4.
•
•
•
(17.560)
3.
•
Transacciones
realizadas en marzo,
abril y mayo.
Alta variabilidad en los
montos declinados.
Transacciones
internacionales.
Transacciones
no
realizadas en la tarde.
Bajo porcentaje de extra
cupo.
Transacciones
frecuentes
en
noviembre.
Poca frecuencia de
transacciones en junio.
•
•
•
•
78
Venta de equipos y servicios de
telecomunicaciones.
Almacenes por departamento sin
supermercado.
Supermercados y tiendas express.
Almacén por departamento con
supermercado.
Estaciones de servicio (venta de
gasolina y gas vehicular).
•
•
•
•
Sin nombre.
Compras en Internet.
Almacenes de computadores y
software.
Entidades financieras.
Compañías de alquiler de vehículos.
Asociaciones
profesionales
y
gremios.
Aerolíneas.
Almacenes por departamento sin
supermercado.
Supermercados y tiendas express.
•
•
•
•
•
•
A.
A.
C y D.
ABA
Transacciones
antiguas, clientes nuevos y
montos altos.
BBA:
Transacciones
recientes, clientes nuevos
y montos altos.
•
En general son clientes nuevos
que generan montos altos de
utilidad.
•
BBA:
Transacciones
recientes, clientes nuevos
y montos altos.
•
No presenta un parámetro
relevante.
Género: Femenino.
Edad: Entre 36 y 55
años.
Estado civil: Sin
parámetro relevante.
Ocupación: Sin
parámetro relevante.
•
•
•
•
•
•
•
•
Género: Sin parámetro
relevante.
Edad: Entre 19 y 25 años
y 26 y los 35 años.
Estado civil: Soltero.
Ocupación:
Independiente.
Género: Masculino.
Edad: Entre 26 y 35
años.
Estado civil: Casado.
Ocupación: Estudiante.
En persona natural presentan
el siguiente comportamiento:
Comportamiento relevante en
personas jurídicas.
•
•
•
•
(27.846)
7.
(62.205)
6.
•
•
•
•
•
Gran
cantidad
de
transacciones
declinadas.
Alta variabilidad en los
montos declinados.
Altos porcentaje de
extra cupo.
Pocas
transacciones
declinadas.
Baja variabilidad en los
montos declinados.
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
79
Servicios de ambulancia.
Comprar en Internet.
Suscripción por cable y otros
servicios de radio y T.V. pagos.
Supermercados y tiendas express.
Almacén por departamento con
supermercado.
Estaciones de servicio (venta de
gasolina y gas vehicular).
Almacenes
de
vestuario
y
accesorios para toda la familia.
Mercadeo directo, servicios de
seguros.
Mercadeo directo, comerciantes de
ventas telefónicas - DIRECTV.
Casinos, juegos de azar, loterías y
rifas.
Sin nombre.
Almacenes de calzado.
Almacenes de electrodomésticos y
gasodomésticos.
Librerías.
Aseguradoras.
Agencias de boletería (producciones
de teatro) excepto cine.
Ópticas y artículos ópticos.
Colegios, universidades, institutos
de educación tecnológica y
prescolar.
B.
No presenta
un
parámetro
relevante.
AAB:
Transacciones
antiguas, clientes antiguos
y montos bajos.
ABA
Transacciones
antiguas, clientes nuevos y
montos altos.
ABB:
Transacciones
antiguas, clientes nuevos y
montos bajos.
BBB:
Transacciones
recientes, clientes nuevos
y montos bajos.
AAA
Transacciones
antiguas, clientes antiguos
y montos altos.
BAA
Transacciones
recientes,
clientes
antiguos y montos altos.
BAB:
Transacciones
recientes,
clientes
antiguos y montos bajos.
En general son clientes
antiguos, con transacciones
recientes y montos altos de
utilidad.
•
•
•
En general son clientes nuevos,
con transacciones antiguas y
montos bajos de utilidad.
•
•
•
•
•
•
•
•
•
•
•
•
Género: Femenino.
Edad: Entre 36 y 55 años
y 56 y los 70 años.
Estado civil: Casado.
Ocupación:
Independiente.
Género: Femenino.
Edad: Entre 19 y 25 años
y 26 y 35 años.
Estado civil: Unión libre.
Ocupación: Empleado.
(4.105)
8.
•
•
Transacciones
internacionales.
Altos promedios de
montos declinados.
•
•
•
•
•
•
•
•
•
A.
•
BBB:
Transacciones
recientes, clientes nuevos
y montos bajos.
80
Fuente: La autora.
Tabla 13. Descripción de las características de los conglomerados.
Sin nombre.
Aerolíneas.
Compras en Internet.
Transporte de carga en general.
Almacenes de computadores y
software.
Entidades financieras.
Hoteles y centros vacacionales.
Compañías de alquiler de vehículos.
Asociaciones
profesionales
y
gremios.
•
•
•
•
Género: Masculino.
Edad: Entre 26 y 35
años.
Estado civil: Casado.
Ocupación:
Independiente.
En persona natural presentan
el siguiente comportamiento:
Comportamiento relevante en
personas jurídicas.
5.5.
POLÍTICAS PROPUESTAS
De acuerdo con los parámetros y características que describen el comportamiento de los tarjetahabientes del
Banco Davivienda S.A. que han declinado sus transacciones por fondos insuficientes, a continuación se
presentan las políticas propuestas como herramienta para mejorar el proceso de valoración y otorgamiento de
extra cupos dentro de la entidad. Cabe destacar que dichas políticas están basadas en un enfoque comercial,
que permite fidelizar al cliente y recompensarlos con características de interés para la entidad.
Los criterios para generar los parámetros de aprobación de extra cupos están basados en el comportamiento
y conocimiento del negocio por parte de la Unidad de Inteligencia de Negocios de la Vicepresidencia de
Medios de Pago21. Se estipularon siete características principales a tener en cuenta en el momento de
autorizar el extra cupo:
1. Los porcentajes de extra cupos autorizados deben oscilar entre el 10% y el 40% del total del cupo
asignado en la tarjeta de crédito. Lo anterior implica que así como el porcentaje de autorización de
extra cupo para todas las tarjetas de crédito de la franquicia Diners es del 20%, las tarjetas de las
franquicias Visa y MasterCard, por abarcar segmentos más diferenciados de clientes, deben permitir
porcentajes de autorización de extra cupos de acuerdo con el tipo de tarjeta o el monto total de cupo.
Se establece la autorización de unos porcentajes entre el 10% y el 20% para cupos menores o
iguales a seis millones de pesos, entre el 21% y el 30% para cupos mayores a seis millones de
pesos, pero menores a diez millones pesos, y un extra cupo de entre 31% y 40% para cupos
mayores a diez millones de pesos.
2. El límite inferior de utilidad por intereses corrientes debe ser de $50.000 anuales.
3. Los clientes que pertenecen a grupos que presentan estacionalidad en el tiempo, es decir, presentan
transacciones en meses específicos del año, deben tener las mismas políticas que los clientes
promedio, pues se considera que los clústeres asociados al segundo trimestre del año y el mes de
noviembre hacen parte de un comportamiento especifico del período estudiado y no conforman un
patrón repetitivo todos los años.
4. A los clientes ejecutivos y a los clientes con transacciones internacionales se les debe autorizar en
todas sus transacciones un 30% de extra cupo, ya que a este tipo de clientes se les da un trato
preferencial dentro del Banco Davivienda S.A.
5. Los clientes promedio tienen un límite máximo de dos extra cupos por año, ya que se espera que
este tipo de clientes no decline con frecuencia sus transacciones por fondos insuficientes. Se
considera que este tipo de clientes está informado de la disponibilidad de cupo antes de realizar sus
compras por lo que no suelen excederse en los montos de sus transacciones.
21
Validado con el Especialista de la Unidad de Inteligencia de Negocios de la Vicepresidencia de Medios de Pago.
81
6. A los clientes del grupo de los compulsivos urgentes se les deben autorizar máximo tres extra cupos
anuales.
7. Los parámetros de comparación para la novedad de las transacciones y la antigüedad con la entidad
deben ser cero meses y dos años, respectivamente.
8. Mantener las políticas actuales de autorización de extra cupos, con la diferencia de que deben ser
realizadas por el Banco Davivienda S.A. y no por las redes dueñas de las franquicias Visa y
MasterCard.
La tabla 14 sintetiza los parámetros estipulados anteriormente a los grupos encontrados.
CONGLOMERADO
1.
POLÍTICA
•
CLIENTES EJECUTIVOS V.I.P.
4. CLIENTES
INTERNACIONALES CON
ALTOS MONTOS.
8. CLIENTES
INTERNACIONALES CON
BAJOS MONTOS.
•
•
•
En el caso contrario se deben
mantener las mismas condiciones
que había estipulado con anterioridad
el Comité de Riesgo del Banco
Davivienda S.A.
•
2. CLIENTES PROMEDIO.
3. CLIENTES
•
•
“NOVEMBRINOS”.
•
5.
CLIENTES SEGUNDO
TRIMESTRE DEL AÑO EN
SUPERMERCADOS.
Antigüedad: Mayor o igual a
dos años.
Facturación
promedio
mensual: 10 veces el ticket
promedio mensual.
Utilidad: Mayor a $500.000
anuales (10 veces el límite
inferior de la utilidad).
Porcentaje de extra cupo:
30%.
Antigüedad: Mayor o igual a
dos años.
Utilidad: Mayor a $50.000
anuales (10 veces el límite
inferior de la utilidad).
Porcentaje de extra cupo:
15%. Máximo dos extra
cupos al año.
Recency: 0 meses.
Se deben mantener las mismas
condiciones que había estipulado con
anterioridad el Comité de Riesgo del
Banco Davivienda S.A.
82
JUSTIFICACIÓN
Se busca con esta política mejorar la
cobertura a este tipo de clientes. Se
sabe que realizan en su mayoría
transacciones internacionales, son
clientes con transacciones recientes y
generan altos montos de utilidad a la
entidad.
La estrategia está encaminada a
flexibilizar el producto y ampliar la
cobertura.
Se busca permitirles acceder a los
bienes y servicios que están
demandando en alguna oportunidad.
6. CLIENTES OCASIONALES.
Se les autorizarán sin ninguna
restricción hasta dos extra cupos al
año, de máximo el 25% del cupo de
cualquiera de sus tarjetas de crédito,
sin importar el número de éstas en su
portafolio.
•
•
7: CLIENTES COMPULSIVOS –
URGENTES.
•
Antigüedad: Mayor o igual a
dos años.
Utilidad: Mayor a $100.000
anuales (2 veces el límite
inferior de la utilidad).
Porcentaje de extra cupo:
20%. Máximo tres extra
cupos al año.
En el caso contrario se deben
mantener las mismas condiciones
que había estipulado con anterioridad
el Comité de Riesgo del Banco
Davivienda S.A.
Se busca flexibilizar la política con
estos clientes dado que su
comportamiento transaccional en
extra cupos es ocasional.
La estrategia busca incrementar el
consumo de este tipo de clientes
permitiéndole acceder a los bienes y
servicios que demandan en los
establecimientos comerciales más
frecuentes. Se enfoca en los mejores
clientes de esta clasificación.
Tabla 14. Políticas por conglomerado.
Fuente: La autora.
En general, las políticas anteriormente mencionadas sirven como herramienta para la optimización del
proceso de valoración y otorgamiento de extra cupos dentro del Banco Davivienda S.A. Sin embargo, es
indispensable que antes de ser implementadas, sean valoradas por el Comité de Riesgo.
83
6.
PROPUESTA FINAL
A continuación se presenta la descripción de la propuesta final.
6.1.
DESCRIPCIÓN GENERAL
La propuesta consiste en generar un archivo dentro del aplicativo AS 400, que basado en las características
encontradas en el presente trabajo de grado, actualice el autorizador de tarjeta de crédito, para otorgar extra
cupos en las transacciones realizadas por los tarjetahabientes del Banco Davivienda S.A., en los casos en
que los cupos no son suficientes para permitirles adquirir los bienes y servicios. La propuesta abarca a todos
los tarjetahabientes y todas las modalidades de tarjeta de crédito ofrecidas por la entidad.
6.2.
METODOLOGÍA PROPUESTA
Para poder generar el archivo dentro del aplicativo AS 400 se debe cruzar la información actualizada de la
calificación de crédito del cliente, los parámetros que establezca el Comité de Riesgo del Banco Davivienda
S.A., los datos del aplicativo y las características propuestas por el presente trabajo de grado, para generar
los parámetros que van a ser introducidos en el autorizador de transacciones.
Se debe tener presente que el uso de esta información es totalmente confidencial, y que el área encargada de
manejar los parámetros de autorización debe ser el Departamento de Monitoreo de Medios de Pago del
Banco Davivienda S.A.
6.3.
OBJETIVO FINAL
El objetivo final es generar un mecanismo que permita asignar adecuadamente extra cupos a los
tarjetahabientes del Banco Davivienda S.A, otorgándolos exclusivamente a los clientes que los requieren y los
pueden pagar, y a los clientes que el Banco Davivienda S.A. considera importantes dentro de su gestión. Lo
anterior implica que se está generando un proceso de valoración y otorgamiento de extra cupos más eficiente,
donde se busca mejorar el servicio al cliente, aumentar la facturación del producto de tarjeta de crédito y
disminuir los costos asociados a éste.
84
6.4.
ASPECTOS IMPORTANTES22
De acuerdo con un análisis previo que se realizó en el Departamento de Monitoreo de Medios de Pago del
Banco Davivienda S.A., se identificó que existen dos aspectos importantes a tener en cuenta en el momento
de implementar la propuesta presentada.
1. Se debe desarrollar un módulo de captura que permita a las áreas de operaciones ingresar los
parámetros definidos por el Comité de Riesgo.
2. Es indispensable generar una opción en el sistema que permita ingresar las tarjetas de crédito de los
clientes que no desean obtener el beneficio de extra cupos.
6.5.
PROCESO INVOLUCRADO
El proceso que se debe llevar a cabo para implementar la propuesta consta de cuatro insumos
fundamentales: (i) Parámetros del Comité de Riesgo, (ii) Calificación Datacrédito, (iii) Parámetros de
comportamiento, RAM y demográficos y (iv) Archivo de excepciones; y dos procesos básicos: (i) Generación
del archivo para el autorizador y (ii) Programación de la funcionalidad del autorizador. A continuación se
presenta la descripción de cada uno de estos.
6.5.1.
1.
Insumos de la propuesta
Parámetros del Comité de Riesgo
El Comité de Riesgo es el encargado de tomar decisiones con respecto a las modificaciones,
recomendaciones e implementaciones de nuevas políticas en los productos y servicios que ofrece el Banco
Davivienda S.A. Con respecto al proceso de valoración y otorgamiento de extra cupos, el Comité ha generado
unos parámetros para el adecuado funcionamiento del servicio dentro de la entidad, por lo tanto, se debe
desarrollar una opción que permita al usuario, mediante un perfil único, el ingreso de los parámetros definidos,
donde se permita especificar los siguientes campos: (i) BIN, (ii) Tipo de tarjeta (principal, amparada,
extendida), (iii)Tipo de extra cupo (fijo o porcentual), (iv) Valor del extra cupo, (v) Máximo valor permitido de
extra cupo en compras nacional, (vi) Máximo valor permitido de extra cupo en avances nacional, (vii) Máximo
valor permitido de extra cupo en compras internacional y (viii) Máximo valor permitido de extra cupo en
avances internacional (BANCO DAVIVIENDA S.A., 2010).
2.
22
Calificación Datacrédito
(BANCO DAVIVIENDA S.A., 2010)
85
El Banco Davivienda S.A. a través del Departamento de Análisis de Riesgo de Crédito tiene acceso a la base
de datos suministrada por Datacrédito. De esta forma, esta área será la encargada de entregar un archivo
plano con el número de cédula y la calificación del cliente, para que junto con el número de identificación se
ubiquen en aplicativo AS 400 los números de tarjetas asociados a cada cliente, identificando el BIN al que
pertenece la tarjeta. La estructura del archivo debe ser: (i) Tipo de identificación, (ii) Número de identificación
y (iii) Calificación (BANCO DAVIVIENDA S.A., 2010).
3.
Parámetros de comportamiento, RAM y demográficos
De acuerdo con los resultados obtenidos en el presente trabajo de grado, se debe desarrollar una opción que
permita al usuario, mediante un perfil único, el ingreso de los parámetros definidos, donde se permita
especificar los siguientes campos: Novedad de las transacciones, Antigüedad del cliente, Rentabilidad del
cliente, MCC más frecuente, Número de transacciones declinadas el último año, Porcentaje de transacciones
nacionales y Porcentaje de transacciones internacionales.
4.
Archivo de excepciones
Se debe crear una opción que permita ingresar el número de cédula y el número de tarjeta de los clientes que
han decidido no acceder al servicio de extra cupos, con el fin de retirarlos del archivo que se enviará al
autorizador. Esta captura debe realizarse centralizadamente en el Departamento de Monitoreo Medios de
Pago (BANCO DAVIVIENDA S.A., 2010).
6.5.2.
1.
Procesos de la propuesta
Generación del archivo para el autorizador
Una vez se ubiquen en aplicativo AS 400 los números de tarjetas asociados a cada cliente identificando el
BIN al que pertenece la tarjeta, se debe generar un archivo donde teniendo como llave de validación el BIN y
la calificación del archivo de DataCrédito, se debe adicionar a cada tarjeta los valores de extra cupo para
compras y avances nacionales o internacionales, teniendo en cuenta la calidad de la misma (principal o
amparada), la definición del tipo de extra cupo determinado en los parámetros del Comité de Riesgo y las
características encontradas en el presente trabajo de grado. Una vez se genere el archivo, deben consultarse
las excepciones y retirar del archivo de salida las tarjetas que se encuentren como excepciones (BANCO
DAVIVIENDA S.A., 2010).
La generación de este archivo debe ser mensual y se debe asegurar la seguridad de la transmisión de
información entre el AS 400 y el Autorizador ON/2.
86
2.
Programación de la funcionalidad del autorizador
Cuando se ha identificado que una transacción debe ser declinada por fondos insuficientes, el autorizador
debe validar el archivo de extra cupos generado por el AS400. Sí la tarjeta se encuentra en el archivo, se
debe sumar al valor disponible en ese momento en el autorizador, el valor del archivo de extra cupo. Sí la
sumatoria es mayor que el valor de la transacción se debe enviar un mensaje de transacción autorizada, de lo
contrario, se debe enviar un mensaje de declinación de la transacción por fondos insuficientes. Una vez se
aprueba la transacción, se debe disminuir el valor utilizado del extra cupo, del valor total autorizado en el
archivo de extra cupos (BANCO DAVIVIENDA S.A., 2010). El gráfico 18 representa este proceso.
Gráfico 18. Proceso de valoración y otorgamiento de extra cupos propuesto.
Fuente: La autora.
Al finalizar el mes, el autorizador debe generar un registro con el detalle de todas las transacciones que
consultaron el archivo de extra cupos, especificando las transacciones aprobadas y las transacciones
declinadas (Ibídem, p. 86).
Cabe aclarar que el Departamento de Monitoreo de Medios Pago del Banco Davivienda S.A. dentro de sus
procedimientos tiene encargado hacer el control y desarrollo de los parámetros que le permiten al Autorizador
73 Stratus ON/ 223 funcionar correctamente. Lo anterior implica que el Analista III encargado de programar la
funcionalidad del Autorizador puede modificar (eliminar o agregar) los parámetros para la autorización de
extra cupos. Actualmente las políticas están ligadas a las decisiones que tome el Comité de Riesgo del Banco
Davivienda en cuanto al correcto funcionamiento del producto de tarjeta de crédito, específicamente la tarjeta
de crédito Diners. Existe la posibilidad de hacer modificaciones en los parámetros de autorización de todas las
tarjetas de crédito de la entidad, es decir que incluye las franquicias Diners, Visa y MasterCard.
23
Medio a través del cual se hacen las autorizaciones o declinaciones de transacciones con tarjeta de crédito.
87
7.
EVALUACIÓN DE LA PROPUESTA
A continuación se presenta la evaluación cualitativa y cuantitativa de la propuesta, con el fin de analizar,
evaluar y medir el impacto que tiene para el Banco Davivienda S.A. la implementación y puesta en marcha de
los parámetros encontrados en el proceso de valoración y otorgamiento de extra cupos.
7.1.
ANÁLISIS CUALITATIVO
Hacer uso de herramientas matemáticas y estadísticas para determinar el comportamiento de los
tarjetahabientes que han declinado sus transacciones por fondos insuficientes, permite al Banco Davivienda
S.A. generar políticas y parámetros eficientes para mejorar el proceso interno de valoración y otorgamiento de
extra cupos. Los impactos de la presente propuesta pueden ser clasificados cualitativamente de acuerdo con
las características más relevantes que están vinculadas al proceso. A continuación se listan los impactos
cualitativos identificados.
1. Segmentación de clientes: La presente propuesta le brinda al Banco Davivienda S.A. la posibilidad
de conocer a sus tarjetahabientes desde tres perspectivas diferentes: comportamiento en
declinaciones por fondos insuficientes, comportamiento histórico con la entidad (novedad de las
transacciones, antigüedad con la entidad y valor monetario) y demografía. Lo anterior le permite un
mejor perfilamiento de sus clientes, y es una herramienta básica para la toma de decisiones y la
generación de estrategias que permitan mejorar los procesos internos de la entidad.
2. Mejor utilización de la información disponible: A través del mecanismo de Minería de Datos
generado, se abre la posibilidad de emplear la información disponible en los aplicativos de la
entidad. Implica una mejor utilización de los recursos disponibles.
3. Servicio al cliente: La propuesta busca mejorar la relación con el cliente adecuándose a las
características más relevantes de cada uno de éstos. El propósito general es mejorar la relación con
el cliente, ofreciéndole un servicio que le permite obtener el beneficio de extra cupo en sus
transacciones con su tarjeta de crédito. Se busca generar herramientas de fidelización del cliente
con la entidad.
4. Imagen del Banco Davivienda S.A.: Autorizar extra cupos a los tarjetahabientes de la entidad
permite mejorar la imagen y la percepción que tienen los clientes de su Banco. Brinda la posibilidad
de que los clientes sientan que el producto de tarjeta de crédito y en general el Banco Davivienda
S.A. lo acompañan y le ofrecen servicios que se ajustan a sus necesidades y expectativas.
88
5. Estrategias de mercado: Permite valorar la posibilidad de otorgar extra cupos a los tarjetahabientes,
basado no sólo en su comportamiento crediticio, sino que también, en estrategias de mercado que
están alineadas con las políticas del Banco y el negocio de las tarjetas de crédito.
6. Proceso eficiente: Se espera que la propuesta contribuya a disminuir los tiempos de operación del
proceso, eliminar las operaciones de consulta de ACIERTA por parte de las redes y disminuir los
costos asociados a esta consulta.
7.2.
ANÁLISIS CUANTITATIVO
De acuerdo con el Informe de Gastos por Servicios de ACIERTA para el año 2010 y el primer cuatrimestre del
2011, suministrado por el Departamento de Monitoreo de Medios de Pago, y el Informe Gerencial de Tarjeta
de Crédito acumulado a octubre de 2011, suministrado por la Unidad de Inteligencia de Negocios de la
Vicepresidencia de Medios de Pagos, se realizó el análisis cuantitativo de la propuesta. A continuación se lista
la información disponible.
1. Costos por servicio de ACIERTA: Como no se cuenta con la información actualizada de los gastos
por servicio de ACIERTA para los últimos cuatrimestres del 2011, se asumirán como base de estudio
los costos presentados en el año 2010. Esta información está disponible en la tabla 15. El costo total
del servicio de ACIERTA es de $326.887.803 anuales.
2010
PRIMER
CUATRIMESTRE
SEGUNDO
CUATRIMESTRE
TERCER
CUATRIMESTRE
TOTAL
NÚMERO
DE TRX
VISA
PROMEDIO
TARIFA DE
CONSULTA ($)
COSTO
TOTAL ($)
NÚMERO DE
TRX MASTER
CARD
PROMEDIO
TARIFA DE
CONSULTA ($)
COSTO TOTAL
($)
44.069
601
26.485.469
99.461
774
76.982.814
47.040
604
28.412.160
88.831
774
68.755.194
52.006
604
31.411.624
122.533
774
94.840.542
143.115
603
$ 86.309.253
310.825
774
$ 240.578.550
Tabla 15. Gastos por servicios de ACIERTA 2010.
Fuente: La autora.
89
$
1.200.000
$
2.400.000
Salario
mensual
$0
$0
Subs.
De
transp.
$ 199.920
$ 99.960
$
99.960
$
199.920
Prima
8,33%
$
49.920
$
99.840
ICBF
3%
SENA
2%
Salud
8,5%
Pensión
12%
$
$
$
$ 144.000
36.000 24.000 102.000
$
$
$
$ 96.000
$ 288.000
72.000 48.000 204.000
$ 48.000
Caja
Vacac.
compen
4,16%
4%
SEGURIDAD
SOCIAL
Fuente: La autora.
Tabla 16. Salario anual con factor prestacional por cargo.
$ 24.000
$ 12.000
Int.
Cesantías
Cesantía
8,33%
1%
PARAFISCALES
$
12.480
$
24.960
ARP
1,04%
$43.879.680
$
$ 3.656.640
1.256.640
Salario
anual
$21.930.840
Salario
mensual
final
$ 628.320 $ 1.828.320
Total FP
52,36%
24
90
Información tomada del Informe de Cobros de Tarjeta de Crédito a mayo de 2011, suministrada por la Superintendencia Financiera de Colombia. El número promedio
de períodos fue suministrado por un Especialista de la Unidad de inteligencia de Negocios de la Vicepresidencia de Medios de Pago del Banco Davivienda S.A.
25 Esta información corresponde a los salarios mensuales vigentes para estos cargos dentro del Banco Davivienda S.A.
Profesional
II
Analista III
Cargos
PRESTACIONES SOCIALES
5. Personal requerido para la realizar el proceso propuesto: Se considera que serán necesarias dos personas para realizar el proceso de minería de
datos que permita generar los parámetros para la autorización de los extra cupos. El personal requerido es: un Analista III con un salario mensual
de $1.200.000 y un Profesional II con un salario mensual de $2.400.00025. La tabla 16 presenta el salario final del personal, incluyendo el factor
prestacional.
4. Variables del producto de tarjeta de crédito: Las variables asociadas a las tarjetas de crédito son: (i) tasa efectiva anual: 26,38%, (ii) número
promedio de cuotas: 9 meses24.
3. Facturación promedio: La facturación promedio mensual de los tarjetahabientes de es $ 267.000.
2. Número de transacciones declinadas a través de POS: De acuerdo con las cifras publicadas en el Informe Gerencial de Tarjeta de Crédito, la
cantidad de transacciones declinadas por fondos insuficientes en el año 2010 fue de 1.219.817, y en el período comprendido entre enero de 2011
y junio de 2011, la cantidad de transacciones declinadas por fondos insuficientes fue de 670.318. El porcentaje promedio anual de declinaciones
es del doce por ciento.
Adicionalmente se deben tener en cuenta los beneficios adicionales que el Banco Davivienda S.A.
entrega a sus empleados: bonos de almuerzo (360 almuerzos a $7.000 cada uno) y uniformes (5
uniformes anuales a $200.000 cada uno). La tabla 17 resume esta información.
SALARIO
ANUAL
ALMUERZOS
UNIFORMES
SALARIO
TOTAL
$21.930.840
$2.520.000
$1.000.000
$25.450.840
$43.879.680
$2.520.000
$1.000.000
$47.399.680
Tabla 17. Salario anual por cargos, incluidos los beneficios del Banco Davivienda S.A.
Fuente: La autora.
6. Herramientas de trabajo: Para la correcta realización de las tareas del personal se hace necesaria la
implementación de dos puestos de trabajo equipados con computadores y software especializado
para la realización de la Minería de Datos (Microsoft Excel, Microsoft Access y SPSS). Se estima que
el costo total de la implementación es de $3.000.000 anuales, en la que se incluyen los servicios
públicos, el hardware, el software y las herramientas de oficina requeridas por el personal.
Es importante aclarar que el impacto de la implementación de la propuesta no puede ser medido en el
escenario actual, pues no se cuenta con la información relacionada con el desempeño de la propuesta. Sin
embargo se propone realizar pruebas piloto, con las políticas más fuertes, para posteriormente analizar el
impacto real de la implementación.
Para el presente análisis se proponen tres posibles escenarios con la implementación de la propuesta: (i)
escenario pesimista, en el que se espera que el porcentaje de transacciones declinadas disminuya máximo un
punto porcentual; (ii) escenario intermedio, en el que se espera que el porcentaje de transacciones declinadas
disminuya máximo hasta cuatro puntos porcentuales y (iii) escenario optimista, en el que se espera que las
transacciones declinadas disminuya hasta siete puntos porcentuales.
La comparación entre los escenarios propuestos y la situación actual busca dar un panorama general del
posible impacto que puede tener la implementación de la propuesta en el nivel de servicio, el número de
transacciones aprobadas, los intereses asociados a estas aprobaciones, el costo de los recursos necesarios
para llevar a cabo el proceso propuesto y los beneficios asociados a éstos, dentro del Banco Davivienda S.A.
La tabla 18 presenta esta comparación26.
26
Comparación basada en los datos disponibles a 2010.
91
ESCENARIO
SITUACIÓN
ACTUAL
SUPUESTOS
IMPACTO
Número de
transacciones
declinadas
1.219.817
Tasa de interés efectiva
anual
26,38%
Número de períodos
promedio anuales
0,75
Ticket promedio
Mano de obra anual
propuesto
$
1.207.619
Tasa de interés efectiva
anual
26,38%
Número de períodos
promedio anuales
0,75
Mano de obra anual
propuesto
ii. INTERMEDIA
$
Número de
transacciones
declinadas
1.171.619
Tasa de interés efectiva
anual
26,38%
Número de períodos
promedio anuales
0,75
Ticket promedio
Mano de obra anual
propuesto
Costo consulta de
ACIERTA
$
267.000
$
(72.850.520)
BENEFICIO TOTAL
Nuevo número de
transacciones
aprobadas
Montos de
transacciones
aprobadas
Interés promedio
anual generado
Herramientas de
trabajo propuestas
Costo consulta de
ACIERTA
Nuevo número de
transacciones
aprobadas
Montos de
transacciones
aprobadas
Interés promedio
anual generado
Herramientas de
trabajo propuestas
$ 1,463,455,743
92
0
$0
$0
$
-
$0
12.198
$ $ 3.256.911.390
$ 368.356.386
$
(3.000.000)
358.356.386
$
267.000
$
(72.850.520)
BENEFICIO TOTAL
$
326.887.803
(326.887.803)
Número de
transacciones
declinadas
Ticket promedio
Número de
transacciones
aprobadas
Montos de
transacciones
aprobadas
Interés promedio
anual generado
Herramientas de
trabajo propuestas
$
267.000
$
-
BENEFICIO TOTAL
i. PESIMISTA
Costo consulta de
ACIERTA
$0
48.793
$ 13.027.645.560
$ 1.473.455.742
$
(3.000.000)
iii. OPTIMISTA
Número de
transacciones
declinadas
1.134.430
Tasa de interés efectiva
anual
26,38%
Número de períodos
promedio anuales
0,75
Ticket promedio
Mano de obra anual
propuesto
$
267.000
$
(72.850.520)
BENEFICIO TOTAL
Costo consulta de
ACIERTA
Nuevo número de
transacciones
aprobadas
Montos de
transacciones
aprobadas
Interés promedio
anual generado
Herramientas de
trabajo propuestas
$0
85.387
$ $ 22.798.329.000
$ 2.578.524.901,11
$
(3.000.000)
$ 2,568,524,901
Tabla 18. Comparación entre la situación actual y los escenarios propuestos
Fuente: La autora.
De lo anterior se puede concluir que la implementación de la propuesta genera un impacto positivo en los
costos actuales del proceso de valoración y otorgamiento de extra cupos. De acuerdo con los parámetros
propuestos, no se haría necesario el contrato con las redes para consultar ACIERTA, lo que implica una
reducción en los costos de aproximadamente 400 millones de pesos. Los beneficios monetarios para la
entidad aumentan considerablemente gracias al aumento del número de transacciones aprobadas.
93
CONCLUSIONES
Una vez culminado el proceso de minería de datos propuesto para optimizar el proceso de valoración y
otorgamiento de extra cupos dentro del Banco Davivienda S.A., se puede concluir que el aprendizaje más
valioso que aportó este trabajo de grado a la organización, fue la posibilidad de personalizar las estrategias
que se pueden aplicar al producto de tarjeta de crédito, de acuerdo con las características propias de cada
cliente.
El análisis de conglomerados dio una visión masiva de las características del cliente. El análisis subsiguiente
sugiere identificar qué hacer con la información, cómo explotarla, cómo sacar el mayor provecho de ella y qué
decisiones tomar en cuanto a los parámetros identificados. Se puede concluir que las acciones a realizar
pueden ir desde el enfoque de la maximización de las utilidades, la identificación de nichos de mercado
relevantes, hasta la modificación de patrones de comportamiento y características significativas. El reto que
propone este tipo de análisis es identificar, una vez se tiene la información, qué se desea hacer con ella. Cabe
destacar que el objetivo principal es generar conocimiento a partir de la información disponible y no generar
juicios de valor sobre asuntos morales que juzguen las preferencias de un determinado conjunto de clientes.
Para esto se hizo necesario el conocimiento del negocio, pues es la base para la generación de estrategias
pertinentes que permitan dinamizar y hacer más eficiente el proceso impactado. La gran ventaja de la minería
de datos y específicamente del análisis de conglomerados de K medias que se llevó a cabo en el presente
trabajo de grado, es que se hizo uso de los recursos propios de la entidad, lo que permitió conocer a los
clientes desde la segmentación propuesta (por comportamiento transaccional, trayectoria dentro del Banco
Davivienda S.A y perfil demográfico), analizando y dando sentido a la información que estaba disponible en el
almacén de datos, pero que con anterioridad no había sido valorada. Este trabajo de grado sirve como
modelo para próximos estudios de este tipo, que busquen generar impactos en otros procesos del Banco
Davivienda S.A.
Adicionalmente, la segmentación RAM, que en principio fue inspirada por el análisis RFM, permite al Banco
Davivienda S.A. generar estrategias encaminadas a fidelizar y retener a los tarjetahabientes, a partir de sus
comportamientos como clientes y su trayectoria dentro la entidad. Este análisis y clasificación puede ser útil
no sólo en el proceso de valoración y otorgamiento de extra cupos, sino que también puede servir como base
para futuros análisis en otros procesos y otras áreas de la entidad.
Todo lo anterior es de gran utilidad ya que los clientes se empiezan a tener en cuenta y pasan a ser parte
activa dentro de los procesos internos de la organización. Se puede concluir que ésta es una primera
aproximación para que los clientes no sean sólo un número más, dentro de una gran base de datos, sino que
también permitan desde sus preferencias y características propias, diferenciar estrategias y políticas que
estén acorde con sus preferencias. Aunque esto implica un riesgo desde el punto de vista crediticio, este tipo
de procesos basados en la segmentación de las características de los clientes, pueden permitir procesos
eficientes que satisfagan las necesidades de los usuarios, ya que se tiene conocimiento de ellos y se sabe de
antemano qué es lo que están buscando y qué es lo que prefieren. La propuesta actual para el proceso de
94
valoración y otorgamiento de extra cupos puede ser interpretada como una herramienta para disminuir el
riesgo de generar extra cupos a personas que de acuerdo con los intereses del Banco Davivienda S.A. no
representan gran impacto e interés, y recompensar a los que presentan características atrayentes desde la
perspectiva del negocio de las tarjetas de crédito. De esta misma forma, el perfil demográfico del cliente
puede permitir a la entidad tener un parámetro predefinido para la valoración de los comportamientos de los
clientes nuevos.
Cabe mencionar que una de las etapas críticas del proceso de minería de datos es la limpieza y
transformación de las variables, pues requiere de un conocimiento profundo de las características que
describen a cada una de éstas. En este proceso se incluyen actividades como la identificación de datos
ausentes, datos atípicos, comportamientos característicos de las variables y la validación de los supuestos
estadísticos. Adicionalmente se requiere de un constante análisis de los objetivos del proyecto para tomar
decisiones que permitan codificar los datos adecuadamente, generar parámetros de interés para el posterior
análisis, y en general ajustar toda la información disponible al desarrollo del proyecto.
Por otro lado, teniendo en cuenta el impacto y valoración cuantitativa del proyecto, se puede afirmar que el
proceso propuesto representa un ahorro de aproximadamente 400 millones de pesos anuales, ya que se
propone no consultar información externa a la entidad, sino que hacer un uso adecuado de la información
disponible internamente. Adicionalmente, se espera que tenga impacto en el número de transacciones
aprobadas anualmente, aumentándolas en aproximadamente 96 mil transacciones, lo que genera un
incremento de los intereses corrientes generados por dichas transacciones, el cual se espera este alrededor
de los 400 mil millones de pesos.
Dentro del desarrollo del presente trabajo de grado se identificaron algunos puntos susceptibles a mejoras,
que en usos futuros pueden contribuir a mejorar el desarrollo de proyectos de este tipo, dentro de la
organización. En primer lugar, sería pertinente hacer una limpieza más sofisticada de la información que entra
al almacén de datos y estandarizar las consultas para el descargue de la información, ya que se espera que
las bases de datos disponibles garanticen la calidad y la veracidad de los datos, y que además pueda ser
utilizada por cualquier usuario de la entidad en menos tiempo y con mayor facilidad. En segundo lugar, es
importante estandarizar la información relacionada con los MCC, pues no se tiene una clasificación clara de
los tipos de establecimientos internacionales, y en los establecimientos comerciales nacionales los códigos
únicos no describen con claridad la clasificación de los grupos.
Finalmente, se propone como continuidad del presente trabajo de grado, extender el análisis considerando
características como: (i) la identificación específica del tipo de cliente, es decir, analizar por separado los
clientes con tarjetas de crédito amparadas, extendidas y principales, pues el presente análisis agrupó y tuvo
en cuenta únicamente las características del cliente principal; (ii) el tipo de tarjeta, es decir, analizar el
portafolio de productos de cada cliente, teniendo en cuenta las franquicias y los segmentos de las tarjetas de
crédito con las que cuenta éste cuenta; y (iii) la segmentación por colores desarrollada por el área de
Investigación de Clientes del Banco Davivienda S.A., las cuales miden características de comportamiento y
trayectoria del cliente dentro de la entidad. Cabe destacar que la información anteriormente mencionada,
aunque está disponible dentro de la entidad, no hizo parte del alcance del presente proyecto.
95
GLOSARIO DE TÉRMINOS
•
ACIERTA: Acierta es un modelo estadístico basado en el comportamiento y hábito de pago histórico de
las personas naturales, brindando a las entidades suscritas a DataCrédito conocer la probabilidad de que
sus clientes incurran en mora de 90 días en los próximos 12 meses. Ofrece como beneficios: la
agilización del proceso de aprobación de créditos, centraliza las decisiones y políticas de crédito, controla
el riesgo de crédito y reduce los costos de evaluación (DataCrédito, 2011).
•
Autorización Transaccional o extra cupo: Porcentaje o monto de dinero que se le autoriza a un
tarjetahabiente, en un momento determinado, para que la transacción de compra, pago de bienes y/o
servicios o avance, no sea rechazada.
•
Autorizador: El autorizador es la persona encargada de tramitar las transacciones de la tarjeta de crédito
cuando en el comercio no se cuenta con un datafono en red. Esta autorización se hace a través del
teléfono, comunicándose directamente con la red dueña de la tarjeta de crédito.
•
Avance: Monto de dinero en efectivo que el banco emisor o establecimiento de crédito otorga a una
persona, a través de su tarjeta de crédito. Este valor es descontado de su cupo disponible y tiene un
costo adicional por la transacción. En ocasiones, el interés asociado a este tipo de transacción es
diferente al de una compra o pago y tiene una tasa un poco más alta.
•
Banca Empresarial: Conjunto de clientes de una entidad bancaria que se caracterizan por ser personas
jurídicas (empresas).
•
Banca Personal: Conjunto de clientes de una entidad bancaria que se caracterizan por ser personas
naturales.
•
Bancarización: Se entiende por bancarización el grado de uso del sistema financiero en las
transacciones entre los diversos agentes económicos; es decir, no sólo la apertura de cuentas de ahorro
o depósitos, sino el uso de toda la gran gama de servicios que ofrece el sistema financiero (Inga, 2008).
•
Bridge o Puente de Red: Dispositivo para la interconexión de redes locales.
•
Calificación: Determina el comportamiento de pago del cliente en el sistema bancario (BANCO
DAVIVIENDA S.A., 2010).
•
Cartera de créditos: Es el conjunto de documentos que amparan los activos financieros o las
operaciones de financiamiento hacia un tercero y que el tenedor de dicho (s) documento (s) o cartera se
reserva el derecho de hacer valer las obligaciones estipuladas en su texto (Definicion.org).
96
•
Cartera Improductiva: Total del saldo de créditos que se encuentran vencidos a la fecha de corte más el
total de créditos que no generan utilidades por intereses (no pago).
•
Castigo de cartera: Se refiere a una provisión de cartera, dentro de un proceso contable o fiscal,
mediante el cual se estipula que los dineros que adeudan los clientes al establecimiento de crédito, no se
van a recuperar. Esto implica que el establecimiento de crédito asuma estos castigos de cartera, como un
gasto adicional dentro de sus operaciones (Gerencie.com, 2011).
•
Compañía de Financiamiento Comercial: Según la normatividad financiera las Compañías de
Financiamiento Comercial - CFC- son establecimientos de crédito que al igual que los bancos se
encuentran vigilados por la Superintendencia Financiera de Colombia y sus captaciones se encuentran
amparadas por el Fondo de Garantías de Instituciones Financieras a través del seguro de depósito. El
Estatuto Orgánico del Sistema Financiero las define como instituciones financieras que captan recursos
mediante depósitos a término con el objeto de realizar operaciones de crédito que facilitan la
comercialización de bienes y servicios y la realización de operaciones de arrendamiento financiero o
leasing (ASOCIACIÓN DE COMPAÑÍAS DE FINANCIAMIENTO COMERCIAL, 2009).
•
Compra: Transacción en la cual se intercambian bienes por dinero.
•
Corporación Financiera: Según el estatuto financiero, son Corporaciones Financieras aquellas
corporaciones que tienen por función principal la captación de recursos a término por medio de depósitos
de instrumentos de deudas de plazo, con el fin de realizar operaciones activas de crédito y efectuar
inversiones, cuyo objeto primordial es fomentar o promover la creación, reorganización, fusión,
transformación y expansión de empresas en los sectores que establezcan las normas que regulan su
actividad (BusinessCol.com, 2011).
•
Cruce: Los cruces hacen referencia a la combinación de dos o más bases de datos, con el fin de obtener
información que se encuentra disponible en todas las bases de datos. Los programas utilizados para
llevar a cabo el manejo y los cruces de las bases de datos fueron Microsoft Access, Microsoft Excel y
SPSS PASW Statistics 18.0.
•
Cupo o Valor Máximo Asignado (VMA): Monto máximo total de dinero asignado por parte de un
establecimiento de crédito o establecimiento financiero a un cliente en un crédito, después de haber
analizado su perfil de crédito.
•
Davivienda.com (canal de internet): Sitio en internet para que desde cualquier lugar del mundo y a
cualquier hora, los clientes puedan realizar sus transacciones y acceder a información de forma
inmediata de los productos y servicios. A través de la página Internet, se pueden: realizar transacciones
(consultas de saldos, movimientos, fechas de pago, cuotas a pagar, extractos, etc.; pagos de crédito de
Davivienda, servicios públicos y privados; pagos automáticos, transferencias (entre cuentas de
Davivienda, entre productos propios y a otras entidades financieras), bloqueos y activaciones (bloqueo de
cuenta, activación Tarjeta de Crédito, activación clave Internet, activación de chequera y Tarjeta Débito),
97
personalización (programar el pago periódico de los productos, programar las transferencias, asignar un
nombre a los productos); obtener información institucional y de los productos y servicios; conocer los
puntos de atención (oficinas y cajeros); comunicarse con Davivienda (atención al cliente: quejas,
sugerencias, reclamos); obtener asesoría acerca de los productos y servicios de Davivienda; conocer las
últimas noticias (novedades); realizar compras en el exterior con cargo a la Tarjeta de Crédito Davivienda
MasterCard y recibirlas en la puerta de la casa; realizar compras en Colombia con cargo a su Cuenta de
Ahorros o Corriente; entre muchas otras consultas y transacciones (DAVIVIENDA S.A., 2006).
•
Datáfono: Dispositivo compacto que se instala en un establecimiento comercial con el fin de permitirle a
los clientes el pago de bienes y servicios a través de las tarjetas de crédito y/o débito.
•
Declinación: Transacción de compra o avance que no pudo ser culminada con éxito debido a causas
relacionadas con el manejo y control de una tarjeta de crédito.
•
Días de mora: Total de días en las que un cliente no ha cumplido con una obligación crediticia.
•
Endeudamiento: Utilización de recursos de terceros, a través de la modalidad de crédito, para
financiamiento de actividades u operaciones.
•
Franquicia: Dentro de los modelos de negocio que se manejan entre las empresas, la franquicia implica
que una empresa otorga licencias, para que otra pueda usar su marca y pueda prestar sus servicios. En
el caso específico del Banco Davivienda S.A. se manejan las franquicias con Visa, MasterCard y Diners.
•
Host: Computador conectado a una red, que provee y utiliza servicios de ella. Los usuarios deben utilizar
hosts para tener acceso a la red. En general, los hosts son computadores monousuario o multiusuario
que ofrecen servicios de transferencia de archivos, conexión remota, servidores de base de datos,
servidores web, etc. Los usuarios que hacen uso de los hosts pueden a su vez pedir los mismos servicios
a otras máquinas conectadas a la red. De forma general un host es todo equipo informático que posee
una dirección IP y que se encuentra interconectado con uno o más equipos (Wikipedia, 2011).
•
Instituciones Oficiales Especiales: Son aquellos que dentro de su marco de política definida para la
colocación de crédito, orientan su portafolio de productos y servicios hacía los renglones económicos
considerados como sectores en desarrollo y que como tal merecen una atención específica por parte de
los programas de gobierno. Algunas instituciones oficiales especiales: Bancoldex, Findeter, la FEN,
Finagro, Fogafin, el Fondo Nacional del Ahorro, entre otras (Knol, 2009).
•
Interés Corriente: Interés cobrado por el establecimiento bancario en el momento de corte, por el uso de
un producto específico. En este caso el interés corriente hace referencia al interés que recauda el banco
por la prestación de su producto de tarjeta de crédito.
•
Interés de Mora: Interés cobrado por el establecimiento bancario a sus clientes, por el no pago oportuno
de sus obligaciones.
98
•
Microcrédito: Se entiende como el sistema de financiamiento a las microempresas, donde el monto
máximo por operación de crédito es de 25 SMLV. Así mismo se estipula que la principal fuente de pago
de estos créditos, debe provenir de los ingresos derivados de las actividades realizadas por las
microempresas (SUPERINTENDENCIA FINANCIERA DE COLOMBIA, 2005).
•
Microempresa: Unidad de producción en la cual hay un máximo de 10 trabajadores empleados y hasta
500 SMLV de capital (Delgado Wiesner & Parra Escobar, 2007).
•
Leasing: Contrato mediante el cual una parte entrega a la otra un activo para su uso y goce, a cambio de
un canon periódico, durante un plazo convenido, a cuyo vencimiento, el bien se restituye a su propietario
o se transfiere al usuario, si este último decide ejercer una opción de adquisición que, generalmente, se
pacta a su favor (FEDELEASING).
•
Organismos Cooperativos de Orden Superior: Se constituyen por conjuntos de fuerzas sociales que
se organizan en forma asociativa identificadas por prácticas autogestionarias, solidarias, democráticas y
humanistas, sin ánimo de lucro para el desarrollo integral del ser humano sujeto y actor de la economía,
cuyo fin radica en satisfacer las necesidades de sus asociados, de prestar servicios y de contribuir a su
desarrollo en lo social, cultural y económico. Están compuestas en principio, por las cooperativas de
primer grado y otras personas jurídicas sin ánimo de lucro (Knol, 2009).
•
Pérdida esperada: Valor total que se calcula se va a dejar de ganar en el momento de otorgar un crédito
a un cliente determinado. Su cálculo es el producto entre la probabilidad de incumplimiento del cliente
con el crédito otorgado, la pérdida dado el incumplimiento (en el momento en que el cliente no cumpla
con su obligación) y el saldo o exposición del crédito.
•
Provisión: Monto de dinero que se destina como sistema de cubrimiento del riesgo, el cual permite
absorber las pérdidas esperadas derivadas de la exposición de los créditos.
•
Relay: Frame Relay o (Frame-mode Bearer Service). Técnica de comunicación mediante retransmisión
de tramas para redes de circuito virtual. Consiste en una forma simplificada de tecnología de
conmutación de paquetes que transmite una variedad de tamaños de tramas o marcos para datos,
perfecto para la transmisión de grandes cantidades de datos. La técnica Frame Relay se utiliza para un
servicio de transmisión de voz y datos a alta velocidad que permite la interconexión de redes de área
local separadas geográficamente a un coste menor (Wikipedia, 2011).
•
Sucursal bancaria: Oficina física de atención al cliente donde el cliente puede realizar las transacciones
asociadas a los productos que tiene con un determinado establecimiento bancario.
•
Saldo o Exposición del Crédito: Valor total que adeuda un cliente en su tarjeta de crédito, después de
haber realizado los pagos correspondientes en un tiempo determinado, es decir, el valor adeudado a la
fecha de corte.
99
•
Tarjeta de crédito: Es un instrumento de pago que permite el uso de un cupo de crédito rotativo para la
adquisición de bienes y servicios en establecimientos afiliados a redes a nivel mundial, pago de
impuestos, avances en efectivo en cajero automático o en las oficinas del banco, por medio de un
plástico otorgado por el Banco Davivienda S.A., con un número único de tarjeta que identifica el negocio
(BANCO DAVIVIENDA S.A., 2010).
•
Tarjetahabiente: Persona que posee una o varias tarjetas de crédito con alguna entidad de crédito.
•
Tarjeta de crédito amparada: Es la tarjeta que se otorga a la persona que el cliente con tarjeta principal
desee, amparando el crédito hasta por el 50% del cupo de la tarjeta principal (BANCO DAVIVIENDA S.A.,
2010).
•
Tarjeta de crédito principal: Es la tarjeta que se otorga al cliente titular del contrato con el Banco
Davivienda S.A (BANCO DAVIVIENDA S.A., 2010).
•
Tarjeta de crédito vigente: Las tarjetas vigentes a la fecha de corte hacen referencia a las tarjetas de
crédito que están activas con la entidad. Esto no implica que transen en los mercados.
•
Teléfono rojo: Es un servicio cómodo, fácil y rápido que le permite a sus clientes realizar operaciones
durante las veinticuatro horas del día, sin moverse de su casa o lugar de trabajo. Al ingresar al Teléfono
Rojo de Davivienda, el cliente marca el número de Cédula o Número de Producto (Cuenta de Ahorros,
Corriente, Tarjeta de Crédito o Crédito) y la clave para el teléfono Rojo, y obtiene automáticamente los
saldos de sus productos del portafolio financiero; y luego podrá seleccionar las opciones para realizar:
Consultas, Pagos, Transferencias, Bloqueo y Activaciones y Servicios Especiales (DAVIVIENDA S.A.,
2006).
•
Ticket promedio: Valor promedio de las transacciones facturadas por los tarjetahabientes.
100
BIBLIOGRAFÍA
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Adriaans, P., & Zantinge, D. (1996). Data Mining. Harlow, Inglaterra: Adisson Wesley -longman.
ALCE INGENIERÍA. (Enero de 2001). La Regresión Logística. Recuperado el 17 de Marzo de 2011,
de http://www.seh-lelha.org/pdf/rlogis1.pdf
Alvarado Valencia, J. A. (01 de noviembre de 2011). Conglomerado de K medias. (P. Beltrán
Herrera, Entrevistador)
Arbeláez, M. A., & Nieto, A. (2006). MERCADO DE TARJETAS EN COLOMBIA Y EL DEBATE
SOBRE LA TARIFA DE INTERCAMBIO. FEDESARROLLO, Bogotá.
ASOCIACIÓN DE COMPAÑÍAS DE FINANCIAMIENTO COMERCIAL. (2009). ¿Qué es una
Compañía de Financiamiento Comercial? Recuperado el 24 de Agosto de 2011, de AFIC:
http://www.afic.com.co/index.php?option=com_content&task=section&id=2&Itemid=5
BANCO DAVIVIENDA S.A. (2010). ACIERTA 2010. Informe de Seguimiento, Banco Davivienda S.A.,
Departamento de Monitoreo de Medios de Pago, Bogotá.
BANCO DAVIVIENDA S.A. (2010). Requerimiento_Extracupos_Autorizador_Jun-30-2010. Bogotá.
Bellotti, T., & Crook, J. (2008). Support vector machines for credit scoring and discovery of significant
features. Expert Systems with Applications, 3302.
Bernal García, J. J., Martínez María- Dolores, S. M., & Sánchez García, J. F. (2003). Universidad
Politécnica de Cartagena. Recuperado el 27 de Octubre de 2011, de MODELIZACIÓN DE LOS
FACTORES MÁS IMPORTANTES QUE CARACTERIZAN UN SITIO EN LA RED:
http://www.uv.es/asepuma/XII/comunica/bernal_martinez_sanchez.pdf
BusinessCol.com. (2011). Corporaciones Financieras. Recuperado el 24 de Agosto de 2011, de
http://www.businesscol.com/empresarial/sistemfin/corpfin.htm
Carbonell Asíns, J. A. (22 de Septiembre de 2011). Descubrir la Sociedad. Recuperado el 30 de
Octubre de 2011, de Análisis de Clúster en SPSS: http://descubrirlasociedad.com/2011/09/analisisde-cluster-en-spss/
Cera Bilbao, C., & Maya Quintero, C. (2009). PROYECTO DE DESARROLLO DE UN MODELO
DINÁMICO DE PREDICTIBILIDAD PARA LA CANCELACIÓN VOLUNTARIA DE TARJETAS DE
CRÉDITO DE LAS MARCAS DINERS, VISA Y MASTERCARD EN EL BANCO DAVIVIENDA S.A.
Bogotá, Colombia.
Cuellar, M. M. (2008). Avances y los obtáculos de la bancarización en Colombia. Recuperado el 24
de
Marzo
de
2011,
de
https://www.bmi.gob.sv/pls/portal/docs/PAGE/BMI_HTMLS/BMI_PULSO_MYPE_IMG/BANCARIZACI
ON_COLOMBIA.PDF
Curso de Introducción y Manejo Básico del SPSS. (s.f.). Recuperado el 30 de Octubre de 2011, de
Técnicas de Análisis Multivariante, Clasificación y Disponibilidad en SPSS:
http://www.uam.es/personal_pdi/economicas/eva/pdf/intro1.pdf
DataCrédito. (2011). ACIERTA. Recuperado el 24 de Agosto de 2011, de DataCrédito Virtual:
http://www.datacredito.com.co/wpsv6/wps/portal/!ut/p/c0/04_SB8K8xLLM9MSSzPy8xBz9CP0os_jQA
PNQX3MPIwMLMy8XAyNjy9Agf7NgY_cAE_2CbEdFAMRuPDo!/?WCM_GLOBAL_CONTEXT=/wps/
101
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
wcm/connect/DataCredito/empresas_pages/solucionesamc/solucionesadquisicion/adquis_adriesgo_
ac
DATAPRIX. (02 de Enero de 2007). Metodología CRISP- DM para Minería de Datos. Recuperado el
16 de Marzo de 2011, de http://www.dataprix.com/introducci%C3%B3n-crisp-dm
DAVIVIENDA S.A. (2006). Davivienda.com. Recuperado el 17 de Marzo de 2011, de Tarjetas de
Crédito: https://linea.davivienda.com/davivienda.jsp
DAVIVIENDA S.A. (2006). Davivienda.com. Recuperado el 24 de Agosto de 2011, de Teléfono Rojo:
https://linea.davivienda.com/opencms/opencms/davivienda/puntosAtencion/telefonoRojo.html
DAVIVIENDA S.A. (2006). Davivienda.com. Recuperado el 24 de Agosto de 2011, de
https://linea.davivienda.com/opencms/opencms/davivienda/puntosAtencion/daviviendaCom.html
DAVIVIENDA S.A. (2009). Flujo de Transacciones Tarjetas de Crédito. Presentación Comité, Banco
Davivienda S.A., Departamento de Medios de Pago, Bogotá.
DAVIVIENDA S.A. (2010). Davivienda. Recuperado el 18 de Marzo de 2011, de
https://linea.davivienda.com/davivienda.jsp
DAVIVIENDA S.A. (2011). Informe Gerencial de Tarjetas de Crédito. Informe Mensual corte junio
2011, Banco Davivienda S.A., Unidad de Inteligencia de Negocios de la Vicepresidencia de Medios
de Pago, Bogotá.
DAVIVIENDA S.A. (2011). Metodologías de Calificación de Carteras. Banco Davivienda S.A.,
Departamento de Riesgo de Crédito, Bogotá.
DAVIVIENDA S.A. (s.f.). Historia del Banco Davivienda S.A. Recuperado el 18 de Marzo de 2011, de
https://linea.davivienda.com/opencms/export/sites/default/davivienda/infoGeneral/GobiernoCorporativ
o/GobiernoCorporativo/HISTORIA_-_FINAL.pdf
Definicion.org. (s.f.). Definición de Cartera de Crédito. Recuperado el 24 de Agosto de 2011, de
http://www.definicion.org/cartera-de-credito
Delgado Wiesner, C., & Parra Escobar, E. (Junio de 2007). CARACTERIZACIÓN DE LA
MICROEMPRESA DE PUNTA - INFORME FINAL. Recuperado el 28 de Junio de 2011, de
http://www.microempresa.com.co/.../Resumenejecutivo(microempresadepunta).doc
Dinero.com. (11 de Mayo de 2011). La bancarización en Colombia llego al 62%. Dinero.com,
http://www.dinero.com/actualidad/economia/articulo/la-bancarizacion-colombia-llego-62/119116.
Donato, J. M., Schryver, J. C., Hinkel, G. C., Schmoyer Jr., R. L., Leuze, M. R., & Grandy, N. W.
(1999). Mining multi-dimensional data for decision support. Future Generation Computer Systems, 9.
FEDELEASING. (s.f.). Federación Colombiana de Compañías de Leasing. Recuperado el 24 de
Agosto de 2011, de Leasing en Colombia: http://www.fedeleasing.org.co/generales.htm
Gerencie.com. (2011). ¿Cómo se castiga la cartera? Recuperado el 24 de Marzo de 2011, de
http://www.gerencie.com/como-se-castiga-la-cartera.html
Gondar, J. E. (2010). José Huerta Consultoria de Información. Recuperado el 15 de Marzo de 2011,
de Introducción a la Minería de Datos: http://www.josebhuerta.com/datamining.htm#3
Hair, J. F. (1999). Análisis Multivariante. Madrid, España: Pearson Education.
http://iie.fing.edu.uyl. (30 de Noviembre de 2000). Recuperado el 20 de Marzo de 2011, de
http://iie.fing.edu.uy/ense/asign/recpat/material/tema3_00-01/node25.html
102
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Inga, P. (2008). Instituto del Perú. Recuperado el 24 de Agosto de 2011, de Bancarización:
http://www.institutodelperu.org.pe/index.php?option=com_content&task=view&id=977&Itemid=130
Knol. (2009). knol, A unit of knowledge. Recuperado el 24 de Agosto de 2011, de INSTITUCIONES
OFICIALES
ESPECIALES:
http://knol.google.com/k/an%C3%B3nimo/instituciones-oficialesespeciales/t0cbkj3hgk0d/1#
Kubski, M. I. (2004). MINERÍA DE DATOS. Recuperado el 21 de Septiembre de 2011, de
http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/MineriaDatosKub.pdf
Lee, T.-S., Chiu, C.-C., Chou, Y.-C., & Lu, C.-J. (2004). Mining the customer credit using
classification and regression tree and multivariate adaptive regression splines. Computaional
Statistics & Data Analysis, 18.
Ngai E.W.T, X. L. (2009). Application of data mining techniques in customer relationship
management: A literature review and classification. Expert Systems with Applications, 2592-2602.
Niea, G., Chenb, Y., Zhanga, L., & Guoc, Y. (2010). Credit card customer analysis based on panel
data clustering. Procedia Computer Science, 2489.
Pascual, D., Pla, F., & Sánchez, S. (s.f.). Algoritmos de Agrupamiento. Recuperado el Marzo19 de
2011, de http://marmota.dlsi.uji.es/WebBIB//papers/2007/1_Pascual-MIA-2007.pdf
Peña Ayala, A. (2006). Tecnologías de la Información: Su Alineamiento al Negocio de las
Organizaciones
.
Recuperado
el
21
de
Septiembre
de
2011,
de
:
http://www.wolnm.org/apa/articulos/Tecnologias_Informacion.pdf?target=
Pita Fernández, S., & Pértega Díaz, S. (2001). Significancia Estadística. Recuperado el 29 de Abril
de 2011, de http://www.fisterra.com/mbe/investiga/signi_estadi/signi_estadi.asp
REVISTA SEMANA. (02 de Mayo de 2011). Las 100 empresas más grandes de Colombia (...y las
900 siguientes). (P. S. S.A., Ed.) SEMANA, 272-288.
Sinnexus.
(2007).
Recuperado
el
20
de
Marzo
de
2011,
de
http://www.sinnexus.com/business_intelligence/datamining.aspx
SOCIEDADES BOLÍVAR. (s.f.). SOCIEDADES_BOLÍVAR. Recuperado el 17 de Marzo de 2011, de
https://www.sociedadesbolivar.com.co
SPSS Inc. (2006). SPSS Preparación de datos 15.0. Recuperado el 20 de Octubre de 2011, de
https://www.u-cursos.cl/ingenieria/2010/1/IN540/1/material_docente/bajar?id_material=272742
SUPERINTENDENCIA FINANCIERA DE COLOMBIA. (Octubre de 2005). Circular Externa 035 de
2005. Recuperado el 24 de Marzo de 2011, de http://www.superfinanciera.gov.co/
SUPERINTENDENCIA FINANCIERA DE COLOMBIA. (31 de Mayo de 2011). Establecimientos de
Crédito - Reporte de Tarjetas de Crédito. Recuperado el 18 de Julio de 2011, de
http://www.superfinanciera.gov.co/
SUPERINTENDENCIA FINANCIERA DE COLOMBIA. (07 de Julio de 2011). Superintendencia
Financiera de Colombia. Recuperado el 28 de Julio de 2011, de http://superfinanciera.gov.co/
Šušteršic, M., Mramor, D., & Zupan, J. (2008). Consumer credit scoring models with limited data.
Expert Systems with Applications, 4736.
Universidad Complutense de Madrid. (s.f.). Capítulo 21. Análisis de conglomerados (I): El
procedimiento Conglomerados de K medias. Recuperado el 10 de Noviembre de 2011, de
http://www.ucm.es/info/socivmyt/paginas/D_departamento/materiales/analisis_datosyMultivariable/21
conglk_SPSS.pdf
103
•
•
•
Vicente Villardón, J. L. (s.f.). Introducción al Análisis de Clúster. Recuperado el 30 de Octubre de
2011, de http://biplot.usal.es/ALUMNOS/CIENCIAS/2ESTADISTICA/MULTIVAR/cluster.pdf
Wikipedia. (04 de Julio de 2011). Frame Relay. Recuperado el 2011 de Agosto de 2011, de
Wikipedia, la enciclopedia libre: http://es.wikipedia.org/wiki/Frame_Relay
Wikipedia. (08 de Julio de 2011). Host. Recuperado el 24 de Agosto de 2011, de Wikipedia, la
enciclopedia libre: http://es.wikipedia.org/wiki/Host
104
ANEXOS
105
2.936.453
2.284.179
1.913.635
1.482.192
1.169.163
1.072.872
924.605
747.528
716.158
609.462
606.302
573.664
534.519
NOMBRE ENTIDAD
BANCOLOMBIA
DAVIVIENDA
BANCO DE BOGOTÁ
BBVA
OCCIDENTE
BANCO POPULAR
RED MULTIBANCA COLPATRIA
BCSC
CITIBANK
LEASING BANCOLOMBIA
BANAGRARIO
BANCO AV VILLAS
HELM BANK
PUESTO
1
2
3
4
5
6
7
8
9
10
11
12
13
INGRESOS DE
INTERESES
2010
(8,8)
(5,8)
(15,4)
(19,8)
(18,4)
(16,5)
2,8
(7,3)
0,8
(19,1)
(20,0)
(1,7)
(15,8)
VAR
(%)
106
120.355
144.047
301.682
200.003
164.478
146.039
186.178
352.220
389.471
420.394
781.811
516.665
1.177.999
UTILIDAD
NETA 2010
(5,3)
30,4
(19,0)
33,0
(25,2)
144,9
22,1
16,0
8,0
15,1
6,9
13,2
17,8
VAR
(%)
9.822.622
6.939.537
14.660.900
7.883.524
8.207.339
8.019.158
10.002.692
12.638.330
17.561.403
22.085.046
37.363.723
28.236.894
48.678.983
ACTIVOS
50,1
15,0
16,6
14,0
13,6
12,7
16,8
16,5
24,2
16,7
29,4
14,0
19,0
VAR
(%)
7.063.046
5.187.302
5.998.579
5.085.816
4.204.236
4.325.241
7.563.719
8.336.333
11.214.448
14.490.668
21.354.626
19.819.439
32.812.578
CARTERA DE
CRÉDITOS Y
OPERACIONES
DE LEASING
56,4
5,3
6,4
7,1
16,6
(9,0)
20,4
26,1
44,2
24,5
20,9
22,1
32,4
VAR
(%)
1.421.149
1.693.122
6.952.000
569.972
2.228.949
2.708.960
1.062.973
2.924.406
3.796.677
3.371.442
10.834.944
4.066.216
6.967.972
INVERSIONES
2010
5,5
33,7
44,5
26,0
8,7
107,7
(4,5)
7,1
0,4
(19,6)
75,2
(2,0)
2,2
VAR
(%)
1.087.245
837.760
1.212.419
816.429
1.428.306
889.909
999.501
1.680.457
2.592.623
2.253.623
5.156.366
3.568.562
7.816.995
PATRIMONIO
2010
Fuente: Superintendencia Financiera de Colombia en Revista Semana. 02 de Mayo de 2011. Edición 1513. Edición Especial. Las 100 Empresas más Grandes de Colombia (… y las 900 siguientes).
Variaciones calculadas con respecto al año 2009.
CIFRAS EN MILLONES DE PESOS
ANEXO A. Las 50 Entidades Financieras de Colombia. Tomado de Revista Semana, Edición 1513, páginas 274 y 275.
6,2
14,0
8,0
15,9
13,7
18,0
15,8
27,3
33,6
11,4
29,7
31,3
12,2
VAR (%)
421.483
284.464
257.088
GNB SUDAMERIS
FINDETER
BANCOLDEX
FONDO NACIONAL DEL
AHORRO
177.481
133.877
107.997
101.880
92.366
66.733
66.722
66.004
62.497
61.617
36.138
32.571
32.139
CÍA. DE FINANCIAMIENTO
TUYA (Antes Sufinanciamiento)
FINAGRO
BANCAMIA
HSBC
FINANDINA
GMAC
LEASING BOLÍVAR
FINAMERICA
SERFINANSA
CONFINANCIERA
L CORFICOLOMBIANA
CMR FALABELLA
CORFICOLOMBIANA
INTERNACIONAL
LEASING BANCOLDEX
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
152.219
161.352
183.020
INVERSORA PICHINCHA
220.293
430.216
BANCO SANTANDER
19
18
14
15
16
17
(9,7)
(23,6)
326,5
23,9
(18,8)
(11,0)
(16,7)
66,1
(22,4)
(35,7)
(8,2)
(32,7)
26,2
(46,8)
(55,4)
(9,9)
2,5
(31,7)
(26,2)
13,6
(15,9)
107
3.134
751
535.914
15.617
13.092
15.825
10.168
5.654
15.016
28.702
26.536
(73.372)
16.110
60.854
37.531
21.242
60.543
98.821
27.025
109.058
96.804
(13,0)
6,4
(18,6)
119,9
2,8
161,9
(16,5)
214,1
46,3
239,8
71,0
357.411
240.375
6.000.583
536.874
604.495
416.683
574.261
361.542
663.976
760.173
835.215
2.069.063
720.606
>
1000%
(51,4)
5.794.928
761.522
1.164.554
4.373.468
5.546.339
4.812.320
8.301.585
6.715.894
(14,1)
25,3
179,6
(66,1)
34,1
3,2
16,4
19,3
17,1
(8,0)
1,4
77,7
(0,3)
(9,3)
0,8
91,3
(21,2)
(8,5)
17,6
33,5
23,7
9,4
(62,0)
(4,9)
10,0
(1,8)
8,4
13,8
20,4
300.921
177.381
-
491.321
521.404
357.263
487.892
320.209
556.902
674.857
713.828
1.315.688
604.691
5.028.504
655.692
1.003.473
2.686.218
4.610.447
4.267.609
3.459.714
4.466.417
15,0
(4,2)
N/A
87,7
3,7
4,0
2,4
110,5
(16,4)
(8,7)
20,9
31,7
28,6
11,8
(61,8)
(0,4)
16,9
16,9
6,1
6,1
19,4
8.311
17.320
4.676.818
3.655
11.516
21.049
23.236
10.657
23.432
10.208
30.500
414.307
954
560.259
891
43.616
1.459.741
725.229
278.713
3.926.762
1.236.318
13,6
9,4
12,1
7,1
(52,6)
(24,5)
(11,7)
4,1
(62,4)
(9,4)
(49,3)
69,4
(68,3)
10,8
.98,5
(20,9)
16,4
63,4
68,6
19,1
17,9
32.047
31.683
2.733.762
85.377
71.471
70.833
71.934
61.639
97.829
192.666
134.318
252.815
186.688
546.696
128.922
184.029
1.782.439
1.382.338
804.990
599.182
700.800
10,8
2,3
9,0
37,2
1,3
18,0
5,6
60,9
14,2
16,4
16,2
39,8
9,6
3,2
(40,0)
13,4
3,5
3,5
3,6
12,9
8,7
50
44
45
46
47
48
49
43
35
36
37
38
39
40
41
42
815
768
462
FNG
FONADE
WWB S.A. (Banco Mundial de
la Mujer)
5.154
SCOTIA BANK COLOMBIA
(Antes RBS Bank)
851
13.179
MACROFINANCIERA
CIT CAPITA
20.391
GIROS Y FINANZAS
1.587
21.233
COOPCENTRAL
MI PLATA S.A.
22.671
DANN REGIONAL
3.253
22.915
PROCREDIT
FOGACOOP
25.702
FACTORING BANCOLOMBIA
3.467
26.023
FEN
JP MORGAN
26.115
COLTEFINANCIERA
N/A
25,2
(70,2)
(37,1)
N/A
(14,1)
(53,1)
(79,2)
71,3
(17,9)
18,8
(25,5)
59,5
(54,4)
(45,0)
(29,9)
108
307
2.309
9.023
428
(1.493)
5.507
7.052
(21.650)
(3.960)
3.772
10.863
400
(9.175)
4.574
51.526
(1.900)
N/A
(84,3)
194,0
(43,5)
N/A
(74,4)
(69,6)
(239,4)
8,8
5,4
(12,0)
104,7
29,1
115,7
(55,7)
(38,2)
70.462
997.928
496.420
18.244
168.986
341.219
736.824
358.219
153.577
212.151
373.935
240.112
189.050
545.920
315.501
456.209
N/A
(13,7)
8,4
4,2
N/A
8,3
38,0
(26,8)
89,5
(1,1)
15,3
9,1
60,9
6,9
(13,1)
22,6
-
-
-
3.230
-
-
-
99.612
123.081
132.834
249.352
205.709
140.772
397.707
3.208
368.328
N/A
N/A
N/A
(25,9)
N/A
N/A
N/A
(24,8)
149,3
10,7
48,3
22,4
70,4
1,5
(43,2)
27,1
-
584.483
444.850
-
51
243.505
426.493
172.152
2.520
22.140
84.289
8.731
15.601
32.093
287.491
19.230
N/A
(23,1)
11,5
N/A
N/A
(2,1)
27,6
(25,3)
70,9
(41,1)
(10,9)
(44,9)
551,6
45,7
(13,2)
(13,5)
70.307
102.194
288.589
17.558
14.938
558.838
335.641
117.718
13.214
35.007
173.004
32.205
32.862
45.308
289.441
49.757
N/A
(2,5)
3,1
2,5
N/A
(20,9)
2,1
(15,2)
(31,5)
5,5
4,6
12,7
(10,6)
4,0
14,1
(4,6)
TOTAL ESTABLECIMIENTOS DE CREDITO
271
221
408.316
71
4.018
2.893
113.676
44.597
32.316
80.990
33.821
4.339
2.747
40.484
17.595
3.702
2.312
24.755
Bloqueadas
temporalmente
109
40.264
66.513
194
1.921
4.799
2.812.108
51.162
17.515
BANCO AGRARIO DE COLOMBIA
AV VILLAS
COOMEVA
CMR FALABELLA
BANCO PICHINCHA
GIROS Y FINANZAS
TUYA S.A.
LA POLAR
14.585
5.804
315
929
4.901
5.413
642
253
4.682
354
1.818
877
8.971
Canceladas
14
621.819
RED MULTIBANCA COLPATRIA
3.158
156
1.923
6.354
8.677
225
33
8.699
1.133
3.861
857
14.737
Vigentes
durante el mes
662
360.698
64.444
71.682
307.271
238.939
41.344
11.783
191.040
43.733
169.817
53.069
567.130
BANCO BOGOTA
BANCO POPULAR
SANTANDER
BANCOLOMBIA
CITIBANK
HSBC
GNB SUDAMERIS
BBVA COLOMBIA
HELM BANK
DE OCCIDENTE
BCSC BANCO CAJA SOCIAL
DAVIVIENDA
Vigentes a la
fecha de corte
CREDIBANCO - VISA
ANEXO B. Informe Tarjetas de Crédito. Superintendencia Financiera de Colombia. Mayo 2011.
13.362
684
3.710
807
11.517
123.840
24.348
231.586
32.780
434.813
61.133
322
322
2.071.069
5.548
137.688
6.121
1.931
6.877
5.186
146
86.553
327.741
174.633
22.796
325.402
4.922
Vigentes
durante el mes
148.567
Vigentes a la
fecha de corte
29.166
14
2.252
2.535
1.429
263
3.342
1.610
6.512
1.075
4.802
2.690
353
2.289
Canceladas
303.788
26.211
62.593
32.299
31.756
68.666
13.663
2.966
40.335
12.568
1.212
11.519
Bloqueadas
temporalmente
NÚMERO DE TARJETAS DE CREDITO
MASTERCARD
26.729
1.154.718
35.711
2.800.867
17.523
710.136
604.038
234.872
10.803
6.337
Vigentes a la
fecha de corte
573
26.682
4.034
71.092
1.785
23.660
7.319
6.965
14
60
210
4.156
9
23.238
152
2.140
9.971
6.451
29
120
Canceladas
OTRAS TARJETAS
Vigentes durante
el mes
2.469
320.955
505
470.409
1
106.660
10.764
28.609
446
Bloqueadas
temporalmente
Numero
Monto total
Compras
110
Monto total
2.092.064
733.014.175.818
163.899
47.791.244.321
17.701
7.685.182.532
18.687
11.785.311.915
707.417 212.407.132.422
109.492
54.867.814.368
13.754
11.449.453.155
4.099
2.903.462.326
114.650
38.670.287.123
14.135
7.984.303.929
96.578
33.162.696.822
55.693
13.712.018.666
240.486 167.238.813.290
167.834
34.162.815.552
12.881
3.495.850.146
60.414
14.418.964.746
9.910
6.527.537.001
23.270
9.366.913.000
258
65.910.000
0
0
260.906
55.318.464.504
0
0
Numero
851.498
63.506
3.105
22.022
299.740
110.916
14.800
4.065
27.562
31.533
61.333
7.002
143.510
53.172
351
8.666
0
0
215
0
0
0
Numero
238.098.734.208
21.987.397.686
1.004.435.960
6.340.154.653
84.960.896.487
26.918.510.794
5.061.185.546
1.712.239.600
7.889.498.178
11.448.140.942
14.788.168.512
1.343.004.919
39.605.102.491
12.786.485.566
114.610.555
2.065.741.626
0
0
73.160.692
0
0
0
Monto total
13.960
794
103
119
6.792
1.741
280
349
651
299
767
94
1.558
264
18
128
0
0
3
0
0
0
Numero
TOTAL TRANSACCIONES POR COMPRAS Y AVANCES
A nivel nacional
En el exterior
Avances
Compras
BANCO BOGOTA
635.209
128.564.094.974
BANCO POPULAR
53.877
8.136.949.744
SANTANDER
208.650
57.739.528.205
BANCOLOMBIA
1.969.173
392.766.658.076
CITIBANK
636.724
119.061.742.175
HSBC
131.756
24.018.197.385
GNB SUDAMERIS
47.153
12.222.249.259
BBVA COLOMBIA
290.949
51.313.565.631
HELM BANK
231.543
57.440.711.794
DE OCCIDENTE
569.994
97.523.101.743
BCSC BANCO CAJA SOCIAL
188.908
30.980.686.478
DAVIVIENDA
1.839.823
366.690.643.954
RED MULTIBANCA COLPATRIA
1.487.726
192.250.670.102
BANCO AGRARIO DE COLOMBIA
39.089
5.143.810.858
AV VILLAS
163.860
25.763.395.518
COOMEVA
3.930
572.296.469
CMR FALABELLA
926.653
126.847.829.616
BANCO PICHINCHA
1.706
348.446.126
GIROS Y FINANZAS
15.545
1.915.918.847
TUYA S.A.
687.876
88.938.101.054
LA POLAR
13.934
2.830.278.762
TOTAL ESTABLECIMIENTOS DE
10.144.078 1.791.068.876.771
CREDITO
Fuente: Formato 466 " Reporte mensual de tarjetas de crédito y débito"
ESTABLECIMIENTOS DE CREDITO
REPORTE DE TARJETAS DE CREDITO
Fecha de corte: Mayo de 2011
Cifras en pesos
7.073.479.224
329.737.622
37.167.089
39.615.764
2.767.720.644
708.244.521
124.255.273
101.408.036
242.247.640
148.503.087
1.921.231.589
18.357.687
513.899.525
68.425.882
11.697.512
40.044.740
0
0
922.613
0
0
0
Monto total
Avances
BANCO BOGOTA
BANCO POPULAR
SANTANDER
BANCOLOMBIA
CITIBANK
HSBC
GNB SUDAMERIS
BBVA COLOMBIA
HELM BANK
DE OCCIDENTE
BCSC BANCO CAJA SOCIAL
DAVIVIENDA
RED MULTIBANCA COLPATRIA
BANCO AGRARIO DE COLOMBIA
AV VILLAS
COOMEVA
CMR FALABELLA
BANCO PICHINCHA
GIROS Y FINANZAS
TUYA S.A.
LA POLAR
COOFINEP
TOTAL ESTABLECIMIENTOS DE
CREDITO
ESTABLECIMIENTOS DE CREDITO
REPORTE DE TARJETAS DE CREDITO
Fecha de corte: Mayo de 2011
Cifras en pesos
9.171.888.386
171.934.894.759
111
438.796.733
39.174.988
165.527.533
940.411.144
2.363.435.277
77.628.656
21.696.787
307.176.367
80.415.155
306.948.891
258.574.975
2.087.179.837
1.049.793.248
33.787.948
65.892.268
0
378.363.896
1.776.374
5.154.898
530.862.782
19.290.630
0
De mora
14.066.259.476
1.179.334.213
4.232.056.078
29.816.859.987
10.671.153.205
2.794.707.229
378.307.914
11.167.493.284
2.455.474.312
9.686.217.817
2.939.924.128
34.107.271.664
19.904.332.501
867.490.569
2.647.937.854
697.373.892
8.625.269.330
23.757.766
158.402.160
15.319.395.496
195.875.884
0
Corrientes
Intereses por compras y avances
82.255.553.411
8.036.091.397
145.774.997
0
34.105.945
613.617.141
231.825.076
130.463.850
0
30.037.459
90.962.006
65.079.527
67.325.689
502.284.503
5.277.750.698
0
20.845.769
10.416.502
15.173.791
0
0
800.428.442
0
0
Conceptos diferentes a capital
Castigos de cartera
3.296.339.156
0
908.896.006
13.197.884.228
4.310.664.020
1.173.741.873
0
1.340.901.614
995.492.486
1.555.844.917
933.964.520
9.473.445.512
38.889.833.198
0
694.238.346
172.404.672
471.337.459
0
0
4.840.565.403
0
0
Capital
TOTAL INTERESES Y CASTIGOS DE CARTERA
438.796.733
39.174.988
165.527.533
940.411.144
2.363.435.277
77.628.656
21.696.787
307.176.367
80.415.155
306.948.891
258.574.975
2.087.179.837
1.049.793.248
33.787.948
65.892.268
0
378.363.896
1.776.374
5.154.898
530.862.782
19.290.630
0
9.171.888.386
171.934.894.759
De mora
14.066.259.476
1.179.334.213
4.232.056.078
29.816.859.987
10.671.153.205
2.794.707.229
378.307.914
11.167.493.284
2.455.474.312
9.686.217.817
2.939.924.128
34.107.271.664
19.904.332.501
867.490.569
2.647.937.854
697.373.892
8.625.269.330
23.757.766
158.402.160
15.319.395.496
195.875.884
0
Corrientes
112
82.255.553.411
3.296.339.156
0
908.896.006
13.197.884.228
4.310.664.020
1.173.741.873
0
1.340.901.614
995.492.486
1.555.844.917
933.964.520
9.473.445.512
38.889.833.198
0
694.238.346
172.404.672
471.337.459
0
0
4.840.565.403
0
0
Capital
8.036.091.397
145.774.997
0
34.105.945
613.617.141
231.825.076
130.463.850
0
30.037.459
90.962.006
65.079.527
67.325.689
502.284.503
5.277.750.698
0
20.845.769
10.416.502
15.173.791
0
0
800.428.442
0
0
Conceptos diferentes a capital
TOTAL INTERESES Y CASTIGOS DE CARTERA
Intereses por compras y avances
Castigos de cartera
Fuente: Formato 466 " Reporte mensual de tarjetas de crédito y débito"
BANCO BOGOTA
BANCO POPULAR
SANTANDER
BANCOLOMBIA
CITIBANK
HSBC
GNB SUDAMERIS
BBVA COLOMBIA
HELM BANK
DE OCCIDENTE
BCSC BANCO CAJA SOCIAL
DAVIVIENDA
RED MULTIBANCA COLPATRIA
BANCO AGRARIO DE COLOMBIA
AV VILLAS
COOMEVA
CMR FALABELLA
BANCO PICHINCHA
GIROS Y FINANZAS
TUYA S.A.
LA POLAR
COOFINEP
TOTAL ESTABLECIMIENTOS DE
CREDITO
ESTABLECIMIENTOS DE CREDITO
REPORTE DE TARJETAS DE CREDITO
Fecha de corte: Mayo de 2011
Cifras en pesos
TOTAL ESTABLECIMIENTOS DE CREDITO
BANCO BOGOTA
BANCO POPULAR
SANTANDER
BANCOLOMBIA
CITIBANK
HSBC
GNB SUDAMERIS
BBVA COLOMBIA
HELM BANK
DE OCCIDENTE
BCSC BANCO CAJA SOCIAL
DAVIVIENDA
RED MULTIBANCA COLPATRIA
BANCO AGRARIO DE COLOMBIA
AV VILLAS
COOMEVA
CMR FALABELLA
BANCO PICHINCHA
GIROS Y FINANZAS
TUYA S.A.
LA POLAR
COOFINEP
ESTABLECIMIENTOS DE CREDITO
REPORTE DE TARJETAS DE CREDITO
Fecha de corte: Mayo de 2011
Cifras en pesos
113
12.309.334.430.462
976.075.246.991
77.331.994.945
272.607.058.551
1.880.460.911.050
1.254.756.927.709
188.540.831.210
34.372.671.132
645.362.742.350
187.753.534.797
482.716.819.384
190.274.035.354
2.311.763.875.420
2.004.161.437.133
53.706.655.919
174.419.819.825
45.814.244.923
590.819.694.534
1.490.778.124
9.203.063.001
912.971.558.244
14.730.259.330
270.538
Saldo de tarjeta de crédito
23.505.982.391.810
1.353.288.115.227
110.916.828.234
702.177.023.045
5.076.721.785.832
1.934.421.929.627
358.244.609.962
81.289.201.634
1.145.426.678.839
557.399.623.203
1.986.942.604.819
252.010.043.832
4.465.534.160.799
2.577.634.225.433
73.697.065.623
236.131.344.788
70.983.024.381
1.797.692.063.207
3.233.636.505
13.922.615.073
683.695.034.276
24.620.777.470
0
Cupo de crédito no utilizado
TOTAL SALDOS CARTERA
ANEXO C. Variables disponibles en el almacén de datos del Banco Davivienda S.A.
La mayoría de la información del cliente con la que cuenta el almacén de datos del Banco Davivienda S.A. es
recopilada a través de los formularios de Solicitud de Crédito que se encuentran disponibles en las sucursales
bancarias. En seguida se presenta la estructura de los dos tipos formularios que actualmente están
disponibles, tanto como para persona natural como para persona jurídica.
SOLICITUD DE CRÉDITO PERSONA
NATURAL
SOLICITUD DE CRÉDITO PERSONA
JURÍDICA
1. Productos a solicitar: Crediexpress fijo,
Crediexpress rotativo, Tarjeta de crédito,
Cuenta Corriente sin Sobregiro, Préstamo
liquidez, Crédito de Vehículo, Crédito
Hipotecario. Información del vendedor.
2. Información
del
primer
solicitante:
Información persona natural, Localización,
Actividad Laboral, Información Financiera,
Finca raíz, Vehículo, Activos y Pasivos,
Referencias, Operaciones internacionales y
autorización de desembolso.
3. Información del segundo solicitante /
amparado / adicional / cónyuge / codeudor /
deudor solidario: Se solicita la misma
información que al primer solicitante.
4. Información para tarjeta joven / crédito
universitario.
1. Productos a solicitar: Crediexpress fijo,
Crediexpress rotativo, Tarjeta de crédito,
Crédito de vehículo, Crédito hipotecario.
Información del vendedor.
2. Información de la empresa: Información
básica persona jurídica, localización,
información financiera, finca raíz, vehículo,
relaciones
financieras,
referencias
comerciales, operaciones internacionales,
vinculación con otras empresas del grupo,
funcionarios autorizados.
5. Información tarjetas convenios de clubes y
colegios.
3. Autorizaciones y declaraciones.
6. Autorizaciones y declaraciones.
114
La información que está disponible en el Almacén de Datos del Banco Davivienda puede clasificarse en: (i)
Información del cliente (demográfica) e (ii) Información transaccional del cliente (comportamiento del cliente).
A continuación se presenta una lista de algunas de las variables que se pueden encontrar dentro del Almacén
de datos, de acuerdo con esta clasificación.
CAMPOS
TIPO_IDENTIFICACION
LUGAR_NACIMIENTO
FECHA_NACIMIENTO
SEXO
ESTADO_CIVIL
ACTIVIDAD_ECONOM/ OCUPACIÓN / PROFESIÓN / NIVEL DE EDUCACIÓN
/ ACTIVIDAD LABORAL
NACIONALIDAD
NUM_PER_CARGO
ESTADO_PERSONA
HOBBY
ANTIGUEDAD_LABORAL
INDICADOR_VIVIENDA / TIPO DE INMUEBLE
DATOS DEMOGRÁFICOS DEL CLIENTE
SEGMENTO
ESTRATO
FUNCIONARIO_PUB (tipo de funcionario)
TIPO_EMPRESA
FECHA_ACTUALIZACION
PERIODO
TIPO_IDENTIFICACION
SEDE
TIPO_EMPRESA / CLASE DE EMPRESA
ACTIVIDAD_ECONOM
NRO_EMPLEADOS
FECHA_CREACION / VIGENCIA EMPRESA
VINCULACION_EMPRESARIAL
NRO_SOCIOS
SEGMENTO
SECTOR_ECONOMICO
SUBSECTOR_ECONOMICO
IND_FILIALES
IND_NEG_NACIONAL
IND_NEG_INTERNACIONAL
FECHA_ACTUALIZACION
SUELDO/ INGRESOS/ ACTIVOS/ INGRESOS LIQ/ RENTA LIQUIDA
EGRESOS / PASIVOS/ OBLIGACIONES
IND_VEHICULO
OPERAC_INTER
VALOR_ARRI_CUOTA
CREDITO_BANC
FECHA_ACTUALIZACION
PROBABILIDAD DE INCUMPLIMIENTO
CALIFICACIÓN DEFINITIVA
p.calificacion,
115
CAMPOS DISPONIBLES
COMPORTAMIENTO DEL CLIENTE
CAMPO BUSCADO
PROMEDIO DE CAPITAL
FACTURADO
MENSUALMENTE
IDENTIFICACIÓN DEL
PRODUCTO
IDENTIFICACIÓN DEL TIPO DE
ESTABLECIMIENTO
PROMEDIO DEL CAPITAL
PAGADO MENSUALMENTE
TOTAL DE CUPO APROBADO
EN TC
PROMEDIO DE CUPO
DISPONIBLE
PROMEDIO DE DÍAS EN
MORA
PROMEDIO DE CUPO
DISPONIBLE PARA AVANCES
FECHA PRIMER AVANCE
FECHA PRIMERA COMPRA
CAPITAL_FACTURADO_MES
capital_facturado,
p.cap_facturado,
COD_PRODUCTO
TIPO DE TARJETA
CADENA_ESTABLECIMIENTO
CATEGORIA_COMERCIO
capital_pagado_mes,
CUPO_APROBADO
CUPO_DISPONIBLE
DIAS_MORA
p.dias_mora,
DISPONIBLE_AVANCE_TC
FECHA_1A_AVANCE
FECHA_1A_COMPRA
FECHA_ACTIVACION
FECHA_APERTURA
FECHA_EMISION
EDAD DEL PRODUCTO
FECHA DE CANCELACIÓN DEL
PRODUCTO
EDAD DE LA MORA
ÚLTIMA FACTURACIÓN
FECHA_CANCELACION
fecha_ingreso_mora,
FECHA_ULT_FACTURACION
fecha_ult_pago_interes,
fecha_ult_pago_ktal,
FECHA_VENCIMIENTO
int_cte_caus_mes,
interes_cte_facturado,
INT_FACTURADO_MES
interes_pagado_mes,
mora_facturada,
MORA_FACTURADA_MES
n_veces_improductividad,
p.nro_veces_improductivo,
nivel_de_riesgo,
ÚLTIMOS PAGOS
FECHA VENCIMIENTO TC
PROMEDIO DE INTERÉS
CAUSADO MENSUALMENTE
PROMEDIO DE MORA
FACTURADA
NO. DE VECES DE
IMPRODUCTIVIDAD
RIESGO
NO. DE CUOTAS
CANCELADAS
nro_cuotas_cancela,
NRO_CUOTAS_MORA
nro_cuotas_mora,
NO. DE CUOTAS EN MORA
116
NO. DE
REESTRUCTURACIONES
LUGAR DE ACTIVACIÓN
PROMEDIO DE INGRESOS /
VALOR DE LA CUOTA DE
PROMEDIO DE CUPO EN
SOBREGIRO
PROMEDIO DE PREPAGOS
PROMEDIO DE SALDO
DISPONIBLE
PROMEDIO DEL SALDO DE
UTLIZACIONES
PROMEDIO DE PAGO
MÍNIMO
PROMEDIO DE PAGO TOTAL
PROMEDIO SALDO A FAVOR
PROMEDIO SALDO AVANCES
nro_reestruct,
NRO_REESTRUCTURACIONES
OFICINA_ACTIVACION
p.cap_prod_cta_manejo,
p.vr_cuota_manejo,
p.cupo_sobregiro,
p.vr_pago_anticipado,
p.vr_saldo_disponible,
p.vr_saldo_utilizaciones,
PAGO_MINIMO
PAGO_TOTAL
SALDO_A_FAVOR
SALDO_AVANCES
SALDO_CAPITAL
SALDO_CAPITAL_EMPLEADOS
COMPORTAMIENTO DEL CLIENTE
PROMEDIO SALDO CAPITAL
PROMEDIO SALDO DE
CAPITAL EN MORA
PROMEDIO SALDO TOTAL EN
COMPRAS
PROMEDIO SALDO CUOTA DE
MANEJO
PROMEDIO CUOTA DE
MANEJO IMPRODUCTIVA
PROMEDIO SALDO DE
SEGUROS
SALDO_CAPITAL_MORA
SALDO_COMPRAS
saldo_cuota_manejo,
saldo_cuota_manejo_i mpr,
saldo_de_seguros,
SALDO_INT_CTE_ACTIVO
SALDO_INT_EXTRACONT
SALDO_INT_MORA
saldo_intereses_ctes,
PROMEDIO SALDOS DE
INTERESÉS
PROMEDIO SALDO EN MORA
DE CAPITAL
PROMEDIO SALDO OTROS
CARGOS
PROMEDIO SALDO SEGUROS
PROMEDIO SEGUROS
FACTURADOS
VALOR PRIMERA COMPRA
VALOR PRIMER AVANCE
PROMEDIO AVANCES
MENSUALES
PROMEDIO COMPRAS
MENSUALES
PROMEDIO DE VALOR EN
MORA
PROMEDIO VALOR DE
REESTRUCTURACIÓN
ÚLTIMA REESTRUCTURACIÓN
sal do_mora_capital,
SALDO_OTROS_CARGOS
SALDO_SEGUROS
seguros_facturados,
VALOR_1A_AVANCE
VALOR_1A_COMPRA
VALOR_AVANCES_MES
VALOR_COMPRAS_MES
VALOR_MORA_PROM
valor_reestruct,
VALOR_ULT_REESTRUCTURACION
117
ANEXO D. Descripción de los MCC codificados.
De acuerdo con la información que el Banco Davivienda S.A. tiene disponible acerca de los establecimientos
en los cuales se registran las transacciones a través de las tarjetas débito y crédito entregadas a sus
tarjetahabientes, se identificaron los siguientes 112 grupos de establecimientos, y a cada uno de ellos se les
asigno un código único que los identifica, para poder llevar a cabo el análisis propuesto en el presente trabajo
de grado.
CÓDIGO
MCC
0
DESCRIPCIÓN GENERAL DE LA AGRUPACIÓN DE
ESTABLECIMIENTOS
SIN NOMBRE
742
CLINICAS VETERINARIAS Y SERVICIOS VETERINARIOS
763
ALMACENES DE EQUIPOS, INSUMOS y SERVICIOS AGROPECUARIOS
780
VIVEROS Y ALMACENES PARA JARDINERIA
1111
AEROLINEAS
1234
OUTLETS
1520
CONTRATISTAS GENERALES - RESIDENCIALES Y COMERCIALES
4111
TRANSPORTE DE PASAJEROS, TERRESTRE, FLUVIAL y MARITIMO
4119
SERVICIOS DE AMBULANCIA
4215
SERVICIOS DE MENSAJERIA, CORREO y ENCOMIENDAS
4444
COMPRAS EN INTERNET
4511
COMPAÑIAS DE AVIACION
4722
AGENCIAS DE VIAJE y OPERADORES DE TURISMO
4789
TRANSPORTE DE CARGA EN GENERAL
4812
VENTA DE EQUIPOS Y SERVICIOS DE TELECOMUNICACIONES.
4899
SUSCRIPCION T.V POR CABLE Y OTROS SERVICIOS DE RADIO Y TELEVISION PAGOS
5045
COMPUTADORES - EQUIPOS - ACCESORIOS - SOTFWARE
5192
SUSCRIPCION Y VENTA DE PERIODICOS Y REVISTAS
5211
DEPOSITO DE MATERIALES DE CONSTRUCCION
5231
ALMACENES DE VIDRIOS Y ESPEJOS
5251
FERRETERIAS
5311
ALMACENES POR DEPARTAMENTO SIN SUPERMERCADO
5331
ALMACENES DE MISCELANEAS, CACHARRERIA Y ARTICULOS PARA REGALO / TODO
TIPO DE ALMACENES
118
CÓDIGO
MCC
DESCRIPCIÓN GENERAL DE LA AGRUPACIÓN DE
ESTABLECIMIENTOS
5411
SUPERMERCADOS / TIENDAS EXPRESS
5422
SALSAMENTARIAS y VENTAS DE CARNES
5441
DULCERIAS
5462
PANADERIAS, REPOSTERIAS, SALONES DE TE Y CAFETERIAS
5499
ALMACEN POR DEPARTAMENTO CON SUPERMERCADO
5511
VENTA DE VEHICULOS AUTOMOTORES Y MOTOCICLETAS
5532
SERVITECAS Y LLANTAS
5533
REPUESTOS Y ACCESORIOS AUTOMOTRICES
5541
ESTACIONES DE SERVICIO ( Venta de Gasolina y gas vehicular)
5551
VENTA DE BOTES Y ACCESORIOS PARA ACTIVIDADES ACUATICAS
5651
ALMACENES DE VESTUARIO Y ACCESORIOS PARA TODA LAFAMILIA
5661
ALMACENES DE CALZADO
5697
SASTRES, MODISTAS, CLINICAS DE ROPA
5712
MUEBLES PARA EL HOGAR y OFICINA
5713
ALMACEN DE TAPETES, ALFOMBRAS Y PISOS
5714
ALMACENES DE COLGADURAS, TAPICERIA Y CUBIERTAS PARA VENTANAS
5719
ALMACENES DE ARTICULOS PARA EL HOGAR
5722
ALMACENES DE ELECTRODOMESTICOS Y GASODOMESTICOS
5732
ALMACENES DE VENTA DE EQUIPOS ELECTRONICOS
5733
ALMACENES DE MUSICA - INSTRUMENTOS MUSICALES, PIANOS, PARTITURAS
5734
ALMACENES DE COMPUTADORES Y SOFTWARE
5735
ALMACENES DE DISCOS
5811
EVENTOS, FIESTAS Y BANQUETES
5812
RESTAURANTES, PIZZERIAS, FUENTES DE SODA
5813
BARES, TABERNAS, DISCOTECAS
5814
VENTA DE COMIDA RAPIDA
5912
DROGUERIAS, FARMACIAS, TIENDAS NATURISTAS
5921
CIGARRERIAS Y LICORERAS
5932
ALMACENES DE ARTICULOS TIPICOS, ANTIGUEDADES ( Ventas, Reparación y
Restauración) / PINTURAS / MUSEOS / ARTE
5940
ALMACEN DE BICICLETAS VENTA Y SERVICIOS
5941
ALMACENES DE ARTICULOS DEPORTIVOS
5942
LIBRERIAS
119
CÓDIGO
MCC
DESCRIPCIÓN GENERAL DE LA AGRUPACIÓN DE
ESTABLECIMIENTOS
5943
PAPELERIAS ( Almacenes de Artículos para Oficina y colegios
5944
ALMACENES DE RELOJES, JOYAS Y PLATERIAS
5945
ALMACENES DE JUEGOS, JUGUETES Y HOBBIES
5946
ALMACENES DE CAMARAS Y EQUIPOS FOTOGRAFICOS
5948
ALMACENES DE ARTICULOS DE CUERO Y MALETAS
5949
ALMACENES DE TELAS
5960
MERCADEO DIRECTO - SERVICIOS DE SEGUROS
5966
MERCADEO DIRECTO - COMERCIANTES DE VENTAS TELEFONICAS / DIRECTV
5968
MERCADEO DIRECTO - COMERCIANTES DE VENTAS TELEFONICAS / AMWAY
5971
GALERIAS DE ARTE - MARQUETERIAS
5975
VENTA DE ARTICULOS MEDICOS, ODONTOLOGICOS, ORTOPEDICOS
5977
PERFUMERIAS y TIENDA DE COSMESTICOS
5983
DISTRIBUIDORES DE MATERIALES PARA COMBUSTIBLE, CARBON, ACEITE
COMBUSTIBLE PETROLEO LIQUIDO, MADERA.
5992
FLORISTERIAS
5995
ALMACENES DE MASCOTAS - ALIMENTOS Y ACCESORIOS PARA MASCOTAS
5999
PRODUCTOS QUIMICOS
6010
ENTIDADES FINANCIERAS
6300
ASEGURADORAS
6513
INMOBILIARIAS
7011
HOTELES - CENTROS VACACIONALES
7033
MOTELES y AMOBLADOS
7210
LAVANDERIAS - LAVASECOS
7230
SALONES DE BELLEZA - PELUQUERIAS
7261
SERVICIOS FUNERARIOS Y PARQUES CEMENTARIOS
7296
ALQULER DE VESTIDOS y DISFRACES
7298
GIMNASIOS, SAUNA, BAÑOS TURCOS y CENTROS DE ESTETICA
7299
GRILES -WISKERIAS- NIGT CLUB -STRIP TEASE,
7311
SERVICIOS DE PUBLICIDAD, MEDIOS Y ARTES GRAFICAS
7338
SERVICIIOS DE REPRODUCCCION Y FOTOCOPIAS
7349
ADMINISTRACION DE AREAS COMUNES, SERVICIOS DE LIMPIEZA, MANTENIMIENTO
Y CELADURIA
120
CÓDIGO
MCC
DESCRIPCIÓN GENERAL DE LA AGRUPACIÓN DE
ESTABLECIMIENTOS
7392
SERVICIOS Y ASESORIAS PROFESIONALES
7393
AGENCIAS DE PROTECCIÓN Y SERVICIOS DE SEGURIDAD
7399
INSUMOS INDUSTRIALES
7512
COMPAÑIAS DE ALQUILER DE VEHICULOS
7523
GARAJES Y PARQUEADEROS
7538
TALLERES DE MECANICA Y LATONERIA Y PINTURA Y SERVICIIOS DE GRUA
7622
ALMACENES DE REPARACIONES ELECTRONICAS
7699
ALMACENES DE REPARACION DE ARTICULOS ELECTRICOS
7832
SALAS DE CINE
7841
TIENDAS DE ALQUILER DE VIDEOS
7922
AGENCIAS DE BOLETERIA ( Producciones de Teatro ) excepto cine
7995
CASINOS Y JUEGOS DE AZAR , LOTERIAS, RIFAS
7997
CLUBES SOCIALES Y DEPORTIVOS
7999
SERVICIOS DE RECREACION
8011
CONSULTORIOS Y SERVICIOS MEDICOS
8043
OPTICAS Y ARTICULOS OPTICOS
8062
CLINICAS - HOSPITALES
8071
LABORATORIOS CLINICOS
8099
MEDICINA PREPAGADA
8220
COLEGIOS, UNIVERSIDADES , INSTITUTOS DE EDUCACION TECNOLOGICA Y
PREESCOLAR
8299
ESCUELAS DE ENSEÑANZA INFORMAL
8398
ORGANIZACIONES DE SERVICIO SOCIAL y DE CARIDAD
8699
ASOCIACIONES PROFESIONALES Y GREMIOS
8999
CONGRESOS Y SEMINARIOS
9311
PAGO DE IMPUESTOS / PAGOS DE TDC
9399
SERVICIOS PUBLICOS
NPI
NO POSEE INFORMACIÓN
121
ANEXO E. Análisis previo de los datos.
El análisis previo de los datos o preparación de datos conduce a una mejor predicción y a una evaluación más
precisa de la dimensión de las variables obtenidas (Hair, 1999). Esto permite obtener un conocimiento básico
de los datos y las relaciones entre las variables. De esta manera, para describir el comportamiento de las
transacciones declinadas por fondos insuficientes, a continuación se presenta la descripción estadística de
cada una de las variables obtenidas en las bases de datos iniciales. Este análisis estadístico fue realizado con
la ayuda del software PASW Statistics 18.0.27
i.
•
BASE DE DATOS AGRUPADA POR CLIENTE
Validación de datos
Se realizó la validación de los datos de la base, el cual consiste en la comprobación de un número fijo de
reglas que permite determinar qué valores de cada una de las variables están fuera de los rangos. “El cuadro
de diálogo Validar datos permite identificar casos, variables y valores de datos no válidos o sospechosos en el
conjunto de datos activo” (SPSS Inc., 2006).
Las reglas que se validaron en PASW 18.0 fueron:
×
×
×
×
×
×
×
×
Porcentaje máximo de valores perdidos: 70 (se aplica a todas las variables).
Porcentaje máximo de casos en una única categoría: 95 (se aplica únicamente a las variables
categóricas28).
Porcentaje máximo de categorías con recuento igual a 1: 90 (se aplica únicamente a las variables
categóricas).
Coeficiente mínimo de variación: 0,001 (se aplica únicamente a las variables de escala29).
Desviación típica mínima: 0 (se aplica únicamente a las variables de escala).
Marcar ID incompletos.
Marcar ID duplicados.
Marcar casos vacíos. Define los casos por todas las variables del conjunto excepto variables ID30.
La validación de datos arrojó el siguiente resultado:
(SPSS Inc., 2006)
Una variable categórica es aquella que indica una categoría, una etiqueta y/o un nombre.
29 Una variable escalar es aquella que toma valores numéricos.
30 Una variable ID es aquella que indica el nombre o el caso en el que se mueven las demás variable.
27
28
122
Fuente: PASW 18.0
De lo anterior se puede concluir que: “Las variables de análisis superaron las comprobaciones básicas y no
hay casos vacíos, por lo que aparece una advertencia que explica por qué no hay ningún resultado que
corresponda a esas comprobaciones” (SPSS Inc., 2006).
•
Datos ausentes
De igual manera se realizó la consulta de los posibles datos ausentes dentro de la base de datos. El análisis
obtenido arrojó que de las 38 variables analizadas, ninguna de ellas presenta datos ausentes o perdidos. A
continuación se presenta el resultado obtenido a través del software SPSS 18.0.31
Fuente: PASW 18.0
31
En el análisis de dato se utilizará “,” para representar decimales y “.” para representar miles.
123
Fuente: PASW 18.0
•
Casos atípicos
“El procedimiento de detección de anomalías busca casos atípicos basados en desviaciones de
las normas de sus agrupaciones. El procedimiento está diseñado para detectar rápidamente
casos atípicos con fines de auditoría de datos en el paso del análisis exploratorio de datos,
antes de llevar a cabo cualquier análisis de datos inferencial. Este algoritmo está diseñado para
la detección de anomalías genéricas; es decir, la definición de un caso anómalo no es
específica de ninguna aplicación particular” (SPSS Inc., 2006).
Sin tener en cuenta las dos variables nominales (“CALIFICACIÓN” y “MCC”), el procedimiento arrojó los
siguientes resultados:
Fuente: PASW 18.0
124
Lo anterior implica que se crearon dos grupos con características similares, en los cuales se indica la cantidad
de datos encontrados y el porcentaje de casos en cada uno de estos. Es decir, existe un primer grupo que
tiene el 86% de datos similares entre ellos y otro con el 14%.
Fuente: PASW 18.0
El índice de anomalía es una medida que refleja la atipicidad del caso respecto al grupo de homólogos. En
este estudio existe un caso extremo que presenta una anomalía de 110,396 mientras que existe un caso que
presenta una anomalía mínima de 2,001. Lo anterior sugiere que hay una distancia significativa entre las
anomalías del primer y el último caso identificado, lo que implica que posiblemente el caso con anomalía
110,396 es realmente un caso atípico.
Igualmente, a continuación se presenta el gráfico de los casos atípicos agrupados en los dos grupos
homogéneos identificados por el software, donde se puede ver con claridad los casos que están alejados del
común de los grupos homogéneos.
Fuente: PASW 18.0
125
Del gráfico anterior se puede concluir que los casos que están señalados dentro de los círculos rojos son los
casos atípicos, más atípicos o los que están más alejados del grupo de homólogos. Dado el alcance y objetivo
del presente trabajo se eliminarán todos los datos atípicos identificados.32 Para eliminar los casos atípicos se
seleccionan los casos que tienen índice de anomalía menor a 2,001 (el menor identificado entre los casos
atípicos) y mayor a 110,391 (el mayor índice de anomalía identificado).
•
Verificación de los supuestos del análisis multivariante
Esta etapa consiste en comprobar los supuestos básicos del análisis multivariante. Esto permite que se
disminuyan las distorsiones y sesgos potenciales de las variables analizadas (Hair, 1999).
A continuación se presenta el análisis estadístico de las variables originales. Se realizaron pruebas de
normalidad, homocedasticidad y linealidad de las variables.
Muestra total: 198.015 casos. Datos atípicos: 1.508. Los datos atípicos representan el 0,77% de la población. Muestra
final: 193.510.
32
126
# DE
TRANSACCIONES
DECLINADAS
VARIABLE
=
.
,
= !. "##
127
La variable “# DE TRANSACCIONES DECLINADAS” no presenta una distribución normal, pues el valor de Z está por encima del
valor crítico Zesperado = +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a la variable para
disminuir la curtosis (561,454 >3; curva leptocúrtica) y asimetría (12,448 > 0; curva asimétrica positiva).
Test de normalidad: =
COMPORTAMIENTO
TOTAL DECLINADO
($)
=
$,%
.
= ""&. '(!
128
La variable “TOTAL DECLINADO ($)” no presenta una distribución normal, pues el valor de Z está por debajo del valor crítico
Zesperado = +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a la variable para disminuir la
curtosis (7404,132 >3; curva leptocúrtica) y asimetría (60,606 > 0; curva asimétrica positiva).
Test de normalidad: =
% EXTRA CUPO
=
.
%,
= (. ))". *)#, "!
129
La variable “% EXTRA CUPO” no presenta una distribución normal, pues el valor de Z está por encima del valor crítico Zesperado =
+/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a la variable para disminuir la curtosis
(43120,199 >3; curva leptocúrtica) y asimetría (0,006 > 0; curva asimétrica positiva).
Test de normalidad: =
Compuesta por las
variables:
FRANQUICIA
RECEPTORA
130
=
Test de normalidad DINERS INTERNAL: =
Test de normalidad DINERS NAL: =
Test de normalidad MASTER INTERNAL: =
=
,%$
= &. "*"
= ". &#
.
.
$,
= (. !#
= −# #
.
%%,
+,$
.
= -. #")
= −#-'
.
=
=
Test de normalidad MASTER NAL: =
%,
+,%$
.
=
=
Test de normalidad VISA INTERNAL: =
Test de normalidad VISA NAL: =
% MASTER
INTERNAL.
% MATER NAL.
% VISA INTERNAL.
% VISA NAL.
•
•
•
•
•
•
131
porc VISA NAL: Curtosis = -1,376 < 3, curva platicúrtica. Asimetría = 0,546 > 0, curva asimétrica positiva.
porc VISA INTERNAL: Curtosis = 23,048 > 3, curva leptocúrtica. Asimetría = 4,811 > 0, curva asimétrica positiva.
porc MASTER NAL: Curtosis = -1,672 < 3, curva platicúrtica. Asimetría = -0,148 < 0, curva asimétrica negativa.
porc MASTER INTERNAL Curtosis = 33,448 > 3, curva leptocúrtica. Asimetría = 5,714 > 0, curva asimétrica positiva.
porc DINERS NAL Curtosis = 74,448 > 3, curva leptocúrtica. Asimetría = 8,279 > 0, curva asimétrica positiva.
porc DINERS INTERNAL Curtosis = 85,378 > 3, curva leptocúrtica. Asimetría = 9,116 > 0, curva asimétrica positiva.
Las variables “porc VISA NAL”, “porc VISA INTERNAL”, “porc MASTER NAL”, “porc MASTER INTERNAL”; “porc DINERS NAL” y
“porc DINERS INTERNAL” no presentan una distribución normal, pues los valores de Z están por debajo o por encima del valor
crítico Zesperado = +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a las variables para
disminuir la curtosis y asimetría.
% DINERS
INTERNAL.
% DINERS NAL.
132
=
=
,$
= &"'
= &"'
.
,$
.
•
•
133
porc TRX NAL: Curtosis = 8,472 > 3, curva leptocúrtica. Asimetría = -3,130 < 0, curva asimétrica negativa.
porc TRX INTERNAL: Curtosis = 8,472 > 3, curva leptocúrtica. Asimetría = 3,130 > 0, curva asimétrica positiva.
Las variables “porc TRX NAL” y “porc TRX INTERNAL” no presentan una distribución normal, pues los valores de Z están por
encima del valor crítico Zesperado = +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a las
variables para disminuir la curtosis y asimetría.
Test de normalidad TRX INTERNAL: =
Compuesta por las
variables:
Test de normalidad TRX NAL: =
TIPO DE
TRANSACCIÓN
Compuesta por las
variables:
HORARIO
FRECUENTE
% TRX INTERNAL
% TRX NAL
=
= −'"
= ("#
= −#-&
.
,
+,
.
.
+,
134
Las variables “porc M” y “porc T” y “porc N” no presentan una distribución normal, pues los valores de Z están por encima o por
debajo del valor crítico Zesperado = +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a las
variables para disminuir la curtosis y asimetría.
=
=
Test de normalidad M: =
Test de normalidad M: =
Test de normalidad M: =
%N
%T
%M
•
•
•
135
porc M: Curtosis = -0,508 < 3, curva platicúrtica. Asimetría = 0.969 > 0, curva asimétrica positiva.
porc T: Curtosis = -1,412 < 3, curva platicúrtica. Asimetría = -0,324 < 0, curva asimétrica negativa.
porc N: Curtosis = 4,009 > 3, curva leptocúrtica. Asimetría = 2,229 > 0, curva asimétrica positiva.
Compuesta por las
siguientes variables:
DÍA FRECUENTE
=
Test de normalidad SÁBADO: =
136
=
=
Test de normalidad VIERNES: =
Test de normalidad JUEVES: =
.
.
,
.
%,$
= #&#
= ('-
=( "
= ("(
= (*-
= '!'
= (-
.
%,%
.
,
.
,%
%,
.
,$
=
=
=
=
Test de normalidad MIÉRCOLES: =
Test de normalidad MARTES: =
Test de normalidad LUNES: =
Test de normalidad DOMINGO: =
% LUNES
% DOMINGO
•
•
•
•
•
•
•
137
porc DOMINGO: Curtosis = 3,600 > 3, curva leptocúrtica. Asimetría = 2,171 > 0, curva asimétrica positiva.
porc LUNES: Curtosis = 4,478 > 3, curva leptocúrtica. Asimetría = 2,315 > 0, curva asimétrica positiva.
porc MARTES: Curtosis = 4,352 > 3, curva leptocúrtica. Asimetría = 2,291 > 0, curva asimétrica positiva.
porc MIÉRCOLES: Curtosis = 4,029 > 3, curva leptocúrtica. Asimetría = 2,224 > 0, curva asimétrica positiva.
porc JUEVES: Curtosis = 3,953 > 3, curva leptocúrtica. Asimetría = 2,213 > 0, curva asimétrica positiva.
porc VIERNES: Curtosis = 3,794 > 3, curva leptocúrtica. Asimetría = 2,173 > 0, curva asimétrica positiva.
porc SÁBADO: Curtosis = 1,894 > 3, curva leptocúrtica. Asimetría = 1,767 > 0, curva asimétrica positiva.
Las variables “porc DOMINGO”, “porc LUNES”, “porc MARTES”, “porc MIÉRCOLES”, “porc JUEVES”, “porc VIERNES” y “porc
SÄBADO” no presentar una distribución normal, pues los valores de Z están por encima del valor crítico Zesperado = +/-1,96,
correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a las variables para disminuir la curtosis y
asimetría
% VIERNES
% JUEVES
%MIÉRCOLES
% MARTES
138
Compuesta por las
siguientes variables:
MES FRECUENTE
% SÁBADO
139
Test de normalidad ENERO: =
=
.
,$
= *&!
=
=
=
Test de normalidad ABRIL: =
Test de normalidad MAYO: =
Test de normalidad JUNIO: =
,$$
=
.
= !#
= #. !((
= #. #.
,
.
,
=
=
= #. ((#
= #. (#(
.
.
,$%
=
= #)
= ""-
= (-
= )*"
= #. (&)
.
,
.
,
.
$,%
.
,%$
= #. !))
140
Las variables “porc ENERO”, “porc FEBRERO”, “porc MARZO”, “porc ABRIL”, “porc MAYO”, “porc JUNIO”, “porc JULIO”, “porc
AGOSTO”, “porc SEPTIEMBRE”, “porc OCTUBRE”, “porc NOVIEMBRE” y “porc DICIEMBRE” no presentan una distribución
normal, pues los valores de Z están por encima del valor crítico Zesperado = +/-1,96, correspondiente a un nivel de error de 0,05. Se
debe aplicar una transformación a las variables para disminuir la curtosis y asimetría.
Test de normalidad DICIEMBRE: =
Test de normalidad NOVIEMBRE: =
Test de normalidad OCTUBRE: =
=
=
Test de normalidad SEPTIEMBRE: =
Test de normalidad AGOSTO: =
,$
.
,
.
,
=
Test de normalidad MARZO: =
Test de normalidad JULIO: =
=
Test de normalidad FEBRERO: =
% FEBRERO
% ENERO
•
•
•
•
•
•
•
•
•
•
•
•
141
porc ENERO: Curtosis = 10,756 > 3, curva leptocúrtica. Asimetría = 3,352 > 0, curva asimétrica positiva.
porc FEBRERO: Curtosis = 12,075 > 3, curva leptocúrtica. Asimetría = 3,518 > 0, curva asimétrica positiva.
porc MARZO: Curtosis = 9,940 > 3, curva leptocúrtica. Asimetría = 3,237 > 0, curva asimétrica positiva.
porc ABRIL: Curtosis = 8,376 > 3, curva leptocúrtica. Asimetría = 3,023 > 0, curva asimétrica positiva.
porc MAYO: Curtosis = 7,340 > 3, curva leptocúrtica. Asimetría = 2,875 > 0, curva asimétrica positiva.
porc JUNIO: Curtosis = 2,048> 3, curva leptocúrtica. Asimetría = 1,854 > 0, curva asimétrica positiva.
porc JULIO: Curtosis = 15,285 > 3, curva leptocúrtica. Asimetría = 3,922 > 0, curva asimétrica positiva.
porc AGOSTO: Curtosis = 14,561 > 3, curva leptocúrtica. Asimetría = 3,830 > 0, curva asimétrica positiva.
porc SEPTIEMBRE: Curtosis = 14,763 > 3, curva leptocúrtica. Asimetría = 3,852 > 0, curva asimétrica positiva.
porc OCTUBRE: Curtosis = 12,477 > 3, curva leptocúrtica. Asimetría = 3,574> 0, curva asimétrica positiva.
porc NOVIEMBRE: Curtosis = 11,465 > 3, curva leptocúrtica. Asimetría = 3,446 > 0, curva asimétrica positiva.
porc DICIEMBRE: Curtosis = 5,554 > 3, curva leptocúrtica. Asimetría = 2,573 > 0, curva asimétrica positiva.
% JUNIO
% MAYO
% ABRIL
% MARZO
142
% OCTUBRE
% SEPTIEMBRE
% AGOSTO
% JULIO
143
COMPORTAMIENTO
MONTO:
% DICIEMBRE
% NOVIEMBRE
144
Compuesta por las
siguientes variables:
=
Test de normalidad MONTO MÁXIMO: =
=
= -( . #*-
.
= &&". !
= #&(. #&
= (!&. #*#
,$
,
.
.
.
,
%$,
=
•
•
•
145
PROMEDIO DECLINACIÓN: Curtosis = 2609,098 > 3, curva leptocúrtica. Asimetría = 32,976 > 0, curva asimétrica positiva.
MONTO MÍNIMO: Curtosis = 3407,819 > 3, curva leptocúrtica. Asimetría = 38,866 > 0, curva asimétrica positiva.
MONTO MÁXIMO: Curtosis = 1921,114 > 3, curva leptocúrtica. Asimetría = 27,726 > 0, curva asimétrica positiva.
DESVIACIÓN ESTÁNDAR: Curtosis = 8609,157 > 3, curva leptocúrtica. Asimetría = 58,861 > 0, curva asimétrica positiva.
Las variables “PROMEDIO DE DECLINACIÓN”, “MONTO MÍNIMO”, “MONTO MÁXIMO” y “DESVIACIÓN ESTÁNDAR no
presentan una distribución normal, pues los valores de Z están por encima del valor crítico Zesperado = +/-1,96, correspondiente a
un nivel de error de 0,05. Se debe aplicar una transformación a las variables para disminuir la curtosis y asimetría.
Test de normalidad DESVIACIÓN ESTÁNDAR: =
=
Test de normalidad MONTO MÍNIMO : =
Test de normalidad PROMEDIO DECLINACIÓN: =
DESVIACIÓN
ESTÁNDAR ($)
MONTO MÁXIMO ($)
MONTO MÍNIMO ($)
PROMEDIO DE
DECLINACIÓN ($)
146
CALIFICACIÓN
147
Lo anterior implica que el 89% de los clientes que registraron transacciones declinadas por fondos insuficientes tienen una
calificación de riesgo A, y tan sólo el 0,7% tienen una calificación de riesgo E.
MCC FRECUENTE
DESCRIPCIÓN
148
5411 SUPERMERCADOS / TIENDAS EXPRESS
5499 ALMACEN POR DEPARTAMENTO CON SUPERMERCADO
5661 ALMACENES DE CALZADO
5651 ALMACENES DE VESTUARIO Y ACCESORIOS PARA TODA LAFAMILIA
0 SIN NOMBRE
5541 ESTACIONES DE SERVICIO ( Venta de Gasolina y gas vehicular)
1111 AEROLINEAS
4812 VENTA DE EQUIPOS Y SERVICIOS DE TELECOMUNICACIONES
5966 MERCADEO DIRECTO - COMERCIANTES DE VENTAS TELEFONICAS / DIRECTV
4444 COMPRAS EN INTERNET
5311 ALMACENES POR DEPARTAMENTO SIN SUPERMERCADO
5912 DROGUERIAS, FARMACIAS, TIENDAS NATURISTAS
5331 ALMACENES DE MISCELANEAS, CACHARRERIA Y ARTICULOS PARA REGALO / TODO TIPO DE ALMACENES
7011 HOTELES - CENTROS VACACIONALES
4722 AGENCIAS DE VIAJE y OPERADORES DE TURISMO
5533 REPUESTOS Y ACCESORIOS AUTOMOTRICES
8699 ASOCIACIONES PROFESIONALES Y GREMIOS
5812 RESTAURANTES, PIZZERIAS, FUENTES DE SODA
5960 MERCADEO DIRECTO - SERVICIOS DE SEGUROS
8220 COLEGIOS, UNIVERSIDADES , INSTITUTOS DE EDUCACION TECNOLOGICA Y PREESCOLAR
5511 VENTA DE VEHICULOS AUTOMOTORES Y MOTOCICLETAS
7995 CASINOS Y JUEGOS DE AZAR , LOTERIAS, RIFAS
5211 DEPOSITO DE MATERIALES DE CONSTRUCCION
5814 VENTA DE COMIDA RAPIDA
5712 MUEBLES PARA EL HOGAR y OFICINA
5942 LIBRERIAS
8011 CONSULTORIOS Y SERVICIOS MEDICOS
5532 SERVITECAS Y LLANTAS
5045 COMPUTADORES - EQUIPOS - ACCESORIOS - SOTFWARE
4511 COMPAÑIAS DE AVIACION
5941 ALMACENES DE ARTICULOS DEPORTIVOS
5732 ALMACENES DE VENTA DE EQUIPOS ELECTRONICOS
5948 ALMACENES DE ARTICULOS DE CUERO Y MALETAS
5251 FERRETERIAS
MCC
37.347
24.898
18.152
13.847
13.819
10.951
8.073
5.488
5.037
4.749
4.110
2.880
2.734
2.492
2.375
2.364
2.125
2.056
1.928
1.695
1.693
1.500
1.312
1.261
1.257
1.200
1.092
993
930
901
844
799
674
651
FRECUENCIA
19,2%
12,8%
9,3%
7,1%
7,1%
5,6%
4,1%
2,8%
2,6%
2,4%
2,1%
1,5%
1,4%
1,3%
1,2%
1,2%
1,1%
1,1%
1,0%
0,9%
0,9%
0,8%
0,7%
0,6%
0,6%
0,6%
0,6%
0,5%
0,5%
0,5%
0,4%
0,4%
0,3%
0,3%
%
MCC FRECUENTE
149
5977 PERFUMERIAS y TIENDA DE COSMESTICOS
6300 ASEGURADORAS
8043 OPTICAS Y ARTICULOS OPTICOS
5722 ALMACENES DE ELECTRODOMESTICOS Y GASODOMESTICOS
9399 SERVICIOS PUBLICOS
763 ALMACENES DE EQUIPOS, INSUMOS y SERVICIOS AGROPECUARIOS
9311 PAGO DE IMPUESTOS / PAGOS DE TDC
1234 OUTLETS
5949 ALMACENES DE TELAS
5719 ALMACENES DE ARTICULOS PARA EL HOGAR
5968 MERCADEO DIRECTO - COMERCIANTES DE VENTAS TELEFONICAS / AMWAY
8062 CLINICAS - HOSPITALES
5422 SALSAMENTARIAS y VENTAS DE CARNES
5944 ALMACENES DE RELOJES, JOYAS Y PLATERIAS
7230 SALONES DE BELLEZA - PELUQUERIAS
7512 COMPAÑIAS DE ALQUILER DE VEHICULOS
7997 CLUBES SOCIALES Y DEPORTIVOS
7922 AGENCIAS DE BOLETERIA (Producciones de Teatro ) excepto cine
5932 ALMACENES DE ARTICULOS TIPICOS, ANTIGUEDADES (Ventas, Reparación y Restauración) / PINTURAS / MUSEOS / ARTE
742 CLINICAS VETERINARIAS Y SERVICIOS VETERINARIOS
5462 PANADERIAS, REPOSTERIAS, SALONES DE TE Y CAFETERIAS
7832 SALAS DE CINE
5946 ALMACENES DE CAMARAS Y EQUIPOS FOTOGRAFICOS
4111 TRANSPORTE DE PASAJEROS, TERRESTRE, FLUVIAL y MARITIMO
1520 CONTRATISTAS GENERALES - RESIDENCIALES Y COMERCIALES
780 VIVEROS Y ALMACENES PARA JARDINERIA
4215 SERVICIOS DE MENSAJERIA, CORREO y ENCOMIENDAS
5813 BARES, TABERNAS, DISCOTECAS
5734 ALMACENES DE COMPUTADORES Y SOFTWARE
7538 TALLERES DE MECANICA Y LATONERIA Y PINTURA Y SERVICIIOS DE GRUA
8299 ESCUELAS DE ENSEÑANZA INFORMAL
8099 MEDICINA PREPAGADA
5943 PAPELERIAS (Almacenes de Artículos para Oficina y colegios)
7298 GIMNASIOS, SAUNA, BAÑOS TURCOS y CENTROS DE ESTETICA
5975 VENTA DE ARTICULOS MEDICOS, ODONTOLOGICOS, ORTOPEDICOS
5713 ALMACEN DE TAPETES, ALFOMBRAS Y PISOS
7033 MOTELES y AMOBLADOS
5735 ALMACENES DE DISCOS
7399 INSUMOS INDUSTRIALES
4119 SERVICIOS DE AMBULANCIA
645
644
602
567
538
486
470
454
453
422
414
397
388
357
350
344
323
307
305
293
293
290
260
256
253
250
193
192
180
155
145
144
138
115
114
104
98
56
56
53
0,3%
0,3%
0,3%
0,3%
0,3%
0,2%
0,2%
0,2%
0,2%
0,2%
0,2%
0,2%
0,2%
0,2%
0,2%
0,2%
0,2%
0,2%
0,2%
0,2%
0,2%
0,1%
0,1%
0,1%
0,1%
0,1%
0,1%
0,1%
0,1%
0,1%
0,1%
0,1%
0,1%
0,1%
0,1%
0,1%
0,1%
0,0%
0,0%
0,0%
MCC FRECUENTE
7261
5192
5733
6010
4789
7311
8398
5945
5231
5921
5551
5441
7392
7999
4899
7841
8071
5940
8999
5995
7523
5999
6513
5811
7299
7338
5992
7622
5714
5971
7349
7393
7699
5697
5983
7210
7296
150
SERVICIOS FUNERARIOS Y PARQUES CEMENTARIOS
SUSCRIPCION Y VENTA DE PERIODICOS Y REVISTAS
ALMACENES DE MUSICA - INSTRUMENTOS MUSICALES, PIANOS, PARTITURAS
ENTIDADES FINANCIERAS
TRANSPORTE DE CARGA EN GENERAL
SERVICIOS DE PUBLICIDAD, MEDIOS Y ARTES GRAFICAS
ORGANIZACIONES DE SERVICIO SOCIAL y DE CARIDAD
ALMACENES DE JUEGOS, JUGUETES Y HOBBIES
ALMACENES DE VIDRIOS Y ESPEJOS
CIGARRERIAS Y LICORERAS
VENTA DE BOTES Y ACCESORIOS PARA ACTIVIDADES ACUATICAS
DULCERIAS
SERVICIOS Y ASESORIAS PROFESIONALES
SERVICIOS DE RECREACION
SUSCRIPCION T.V POR CABLE Y OTROS SERVICIOS DE RADIO Y TELEVISION PAGOS
TIENDAS DE ALQUILER DE VIDEOS
LABORATORIOS CLINICOS
ALMACEN DE BICICLETAS VENTA Y SERVICIOS
CONGRESOS Y SEMINARIOS
ALMACENES DE MASCOTAS - ALIMENTOS Y ACCESORIOS PARA MASCOTAS
GARAJES Y PARQUEADEROS
PRODUCTOS QUIMICOS
INMOBILIARIAS
EVENTOS, FIESTAS Y BANQUETES
GRILES -WISKERIAS- NIGT CLUB -STRIP TEASE,
SERVICIIOS DE REPRODUCCCION Y FOTOCOPIAS
FLORISTERIAS
ALMACENES DE REPARACIONES ELECTRONICAS
ALMACENES DE COLGADURAS, TAPICERIA Y CUBIERTAS PARA VENTANAS
GALERIAS DE ARTE - MARQUETERIAS
ADMINISTRACION DE AREAS COMUNES, SERVICIOS DE LIMPIEZA, MANTENIMIENTO Y CELADURIA
AGENCIAS DE PROTECCIÓN Y SERVICIOS DE SEGURIDAD
ALMACENES DE REPARACION DE ARTICULOS ELECTRICOS
SASTRES, MODISTAS, CLINICAS DE ROPA
DISTRIBUIDORES DE MATERIALES PARA COMBUSTIBLE, CARBON, ACEITE COMBUSTIBLE PETROLEO LIQUIDO, MADERA.
LAVANDERIAS - LAVASECOS
ALQULER DE VESTIDOS y DISFRACES
53
47
46
44
43
43
42
37
33
30
27
26
26
22
20
16
16
15
15
12
9
8
7
6
6
6
5
5
3
3
3
3
3
2
2
2
1
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
MCC FRECUENTE
151
Se puede concluir que los seis MCC que presentan más declinaciones por fondos insuficientes son: primero, el 5411
correspondiente a SUPERMERCADOS / TIENDAS EXPRESS, seguido por el 5499 que hace referencia a ALMACENES POR
DEPARTAMENTO CON SUPERMERCADO, tercero, el 5661 correspondiente a ALMACENES DE CALZADO, seguido por el
5651 correspondiente a ALMACENES DE VESTUARIO Y ACCESORIOS PARA TODA LA FAMILA, cuarto el 5541
correspondiente a ESTACIONES DE SERVICIO (Venta de gasolina y gas vehicular) y finalmente, el 1111 correspondiente a
AEROLINEAS. En el caso del MCC 0 correspondiente a establecimiento SIN NOMBRE se puede afirmar que presenta el 7,1% de
la muestra.
Adicionalmente, la homocedasticidad de la dependencia de las variables requiere de un análisis de la
varianza o ANOVA. Este test no se realizará ya que se considera que sí las variables no presentan
normalidad, es muy probable que tampoco presenten homocedasticidad. De acuerdo con lo expuesto por
Hair, en su libro Análisis Multivariante: “En muchas ocasiones la heterocidasticidad es el resultado de la no
normalidad de una de las variables, y la corrección de la no normalidad resuelve igualmente la dispersión de
la varianza” (Hair, 1999).
ii.
BASE DE DATOS AGRUPADA POR MCC
Este análisis no es necesario ya que después de analizar la base de datos agrupada por cliente se identificó
que las variables incluidas en la base de datos agrupada por MCC, se describan a través de las variables de
la base anterior.
iii.
•
BASE DE DATOS CON INFORMACIÓN DEL PRODUCTO DE TARJETA DE CRÉDITO
Validación de datos
Se validaron las mismas reglas de la base anteriormente analizada con la ayuda del software PASW 18.0. La
validación de datos arrojó el siguiente resultado:
Fuente: PASW 18.0
De lo anterior se puede concluir que: “Las variables de análisis superaron las comprobaciones básicas y no
hay casos vacíos, por lo que aparece una advertencia que explica por qué no hay ningún resultado que
corresponda a esas comprobaciones” (SPSS Inc., 2006).
•
Datos ausentes
De igual manera se realizó la consulta de los posibles datos ausentes dentro de la base de datos. El análisis
obtenido arrojó que de las 3 variables analizadas, ninguna de ellas presenta datos ausentes o perdidos. A
continuación se presenta el resultado obtenido a través del software SPSS 18.0.
152
Fuente: PASW 18.0
•
Casos atípicos
El procedimiento arrojó los siguientes resultados:
Fuente: PASW 18.0
Lo anterior implica que se crearon siete grupos con características similares, en los cuales se indica la
cantidad de datos encontrados y el porcentaje de casos en cada uno de estos. Es decir, existe un primer
grupo que tiene el 20% de datos similares entre ellos y otros con una distribución uniforme alrededor del 14%.
Fuente: PASW 18.0
El índice de anomalía es una medida que refleja la atipicidad del caso respecto al grupo de homólogos. En
este estudio existe un caso extremo que presenta una anomalía de 512,892 mientras que existe un caso que
presenta una anomalía mínima de 3,083. Lo anterior sugiere que hay una distancia significativa entre las
153
anomalías del primer y el último caso identificado, lo que implica que posiblemente el caso con anomalía
512,892 es realmente un caso atípico.
Igualmente, a continuación se presenta el gráfico de los casos atípicos agrupados en los dos grupos
homogéneos identificados por el software, donde se puede ver con claridad los casos que están alejados del
común de los grupos homogéneos.
Fuente: PASW 18.0
Del gráfico anterior se puede concluir que los casos que están señalados dentro de los círculos rojos son los
casos atípicos, más atípicos o los que están más alejados del grupo de homólogos. Dado el alcance y objetivo
del presente trabajo se eliminarán todos los datos atípicos identificados.33 Para eliminar los casos atípicos se
seleccionan los casos que tienen índice de anomalía menor a 3,083 (el menor identificado entre los casos
atípicos) y mayor a 512,892 (el mayor índice de anomalía identificado).
•
Verificación de los supuestos del análisis multivariante
Esta etapa consiste en comprobar los supuestos básicos del análisis multivariante. Esto permite que se
disminuyan las distorsiones y sesgos potenciales de las variables analizadas (Hair, 1999). A continuación se
presenta el análisis estadístico de las variables originales. Se realizaron pruebas de normalidad,
homocedasticidad
y
linealidad
de
las
variables.
833 Muestra total: 195.01 casos. Datos atípicos: 9,751. Los datos atípicos representan el 5,0007% de la población.
Muestra final: 185.267.
154
ESTADÍSTICOS
VARIABLE
155
COMPORTAMIENTO
RECENCY (meses)
=
+,
.
= − !, ')
156
La variable “RECENCY (meses)” no presenta una distribución normal, pues el valor de Z está por debajo del valor crítico Zesperado
= +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a la variable para aumentar la curtosis
(-0,560 >3; curva platicúrtica) y asimetría (0,92 > 0; curva asimétrica positiva).
Test de normalidad: =
ANTIQUITY (años)
=
,
.
= #. (-#, )"
157
La variable “ANTIQUITY (años)” no presenta una distribución normal, pues el valor de Z está por encima del valor crítico Zesperado
= +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a la variable para disminuir la curtosis
(14,664 >3; curva leptocúrtica) y asimetría (2,993 > 0; curva asimétrica positiva).
Test de normalidad: =
MONETIZE ($/año)
=
.
$.%,$
= #. (-#, )"
158
La variable “MONETIZE ($/año)” no presenta una distribución normal, pues el valor de Z está por encima del valor crítico Zesperado
= +/-1,96, correspondiente a un nivel de error de 0,05. Se debe aplicar una transformación a la variable para disminuir la curtosis
(16032,297 >3; curva leptocúrtica) y asimetría (251,144> 0; curva asimétrica positiva).
Test de normalidad: =
Adicionalmente, la homocedasticidad de la dependencia de las variables requiere de un análisis de la
varianza o ANOVA. Este test no se realizará ya que se considera que sí las variables no presentan
normalidad, es muy probable que tampoco presenten homocedasticidad. De acuerdo con lo expuesto por
Hair, en su libro Análisis Multivariante: “En muchas ocasiones la heterocedasticidad es el resultado de la no
normalidad de una de las variables, y la corrección de la no normalidad resuelve igualmente la dispersión de
la varianza” (Hair, 1999).
iv.
•
BASE DE DATOS DEMOGRÁFICA
Validación de datos
Se validaron las mismas reglas de la base anteriormente analizada con la ayuda del software PASW 18.0. La
validación de datos arrojó el siguiente resultado:
Fuente: PASW 18.0
De lo anterior se puede concluir que: “Las variables de análisis superaron las comprobaciones básicas y no
hay casos vacíos, por lo que aparece una advertencia que explica por qué no hay ningún resultado que
corresponda a esas comprobaciones” (SPSS Inc., 2006).
•
Datos ausentes
De igual manera se realizó la consulta de los posibles datos ausentes dentro de la base de datos. El análisis
obtenido arrojó que de las 4 variables analizadas, ninguna de ellas presenta datos ausentes o perdidos. A
continuación se presenta el resultado obtenido a través del software SPSS 18.0.
Fuente: PASW 18.0
•
Verificación de los supuestos del análisis multivariante
A continuación se presenta el análisis estadístico de las variables originales.
159
EDAD
ESTADÍSTICOS
VARIABLE
160
COMPORTAMIENTO
OCUPACIÓN
GÉNERO
161
ESTADO CIVIL
162
La población de tarjetahabientes que declinan sus transacciones por fondos insuficientes en su mayoría son personas entre los
36 y los 55 años, de ocupación empleados y de estado civil casados. No presenta una diferencia significativa con respecto al
género de los clientes.
12,448
Asimetría
Positiva
60,606
Asimetría
Positiva
ASIMETRÍA
0,383
Platicúrtica
1,165
Platicúrtica
CURTOSIS
1,186
Asimetría
Positiva
-0,032
Asimetría
Negativa
ASIMETRÍA
VARIABLE
TRANSFORMADA
-99,9948%
-99,7925%
CURTOSIS
-100,053%
-90,4724%
ASIMETRÍA
VARIACIÓN
PORCENTUAL
-99,959%
-99,466%
CURTOSIS
100%
100%
ASIMETRÍA
VARIACIÓN IDEAL
CHECK
34
163
Se plantea esta transformación ya que la mayoría de las variables presentan comportamientos leptocúrticos y asimetrías positivas. Se aplica el logaritmo en base 10 de
las variables más la unidad, ya que existen valores mínimos iguales o cercanos a 0, y la función logaritmo en base 10 no está definida para este valor [log(0/ = ∄].
7404,132
Leptocúrtica
TOTAL DECLINADO ($)
CURTOSIS
561,454
Leptocúrtica
VARIABLE
VARIABLE INICIAL
BASE AGRUPADA POR CLIENTE
# DE TRANSACCIONES
DECLINADAS
•
Una vez eliminados los casos atípicos del estudio, se procede a realizar la transformación de las variables. La transformación utilizada fue la de logaritmo
en base 10 [log( + 1)] de cada una de las variables34. A continuación se presenta un resumen y descripción de éstas de acuerdo con la curtosis y la
asimetría que presentaban en el escenario inicial y las presentadas después de la transformación. Adicionalmente se presenta la variación porcentual que
produjo la transformación en los valores de las curtosis y las asimetrías, comparadas frente a la variación ideal (escenario en que las distribuciones fueran
normales, con curtosis 3 y asimetría 0, es decir, mesocúrticas y simétricas). Finalmente, la columna “CHECK” indica cuales de las variables presentaron
una variación adecuada de sus curtosis y asimetrías (se acercaron al escenario ideal: distribución normal).
De acuerdo con la descripción estadística inicial de las variables, se identificó que se hace necesario transformarlas con el fin de disminuir la curtosis y la
asimetría. De acuerdo con lo expuesto por Hair en su libro Análisis Multivariante, las transformaciones de los datos proporcionan un medio para modificar
las variables por una o dos razones: corregir el incumplimiento de los supuestos estadísticos subyacentes de las técnicas multivariantes o mejorar la
relación entre las variables. Las transformaciones de los datos proporcionan el medio principal para corregir la normalidad y la heterocedasticidad (Hair,
1999).
ANEXO F. Transformación de las variables.
43120,199
Leptocúrtica
-1,376
Platicúrtica
23,048
Leptocúrtica
-1,672
Platicúrtica
33,448
Leptocúrtica
77,448
Leptocúrtica
85,378
Leptocúrtica
8,472
Leptocúrtica
8,472
Leptocúrtica
-0,508
Platicúrtica
-1,412
Platicúrtica
4,009
Leptocúrtica
% EXTRA CUPO
% VISA NAL
% VISA INTERNACIONAL
% MASTER NACIONAL
% MASTER
INTERNACIONAL
%DINERS NAL
% DINERS
INTERNACIONAL
% TRX NAL
% TRX INTERNAL
%M
%T
%N
0,548
Asimetría
Positiva
4,811
Asimetría
Positiva
-0,148
Asimetría
Negativa
5,714
Asimetría
Positiva
8,279
Asimetría
Positiva
9,116
Asimetría
Positiva
-3,130
Asimetría
Negativa
3,130
Asimetría
Positiva
0,969
Asimetría
Positiva
-0,324
Asimetría
Negativa
2,229
Asimetría
Positiva
0,006
Asimetría
Positiva
-0,509
Platicúrtica
-0,431
Platicúrtica
-1,824
Platicúrtica
4,196
Leptocúrtica
15,095
Leptocúrtica
50,488
Leptocúrtica
27,945
Leptocúrtica
15,942
Leptocúrtica
-1,323
Platicúrtica
11,032
Leptocúrtica
-1,865
Platicúrtica
0,341
Platicúrtica
164
-0,072
Asimetría
Negativa
3,542
Asimetría
Positiva
-0,740
Asimetría
Negativa
4,157
Asimetría
Positiva
5,333
Asimetría
Positiva
7,133
Asimetría
Positiva
-4,057
Asimetría
Negativa
2,445
Asimetría
Positiva
0,123
Asimetría
Positiva
-1,170
Asimetría
Negativa
1,126
Asimetría
Positiva
0,173
Asimetría
Positiva
-112,6964%
-69,4759%
259,0551%
-50,4721%
78,1752%
-40,8653%
-63,9177%
-52,3380%
-20,8732%
-52,1347%
35,538%
-99,9992%
-49,4841%
261,1111%
-87,3065%
-21,8850%
29,6166%
-21,7530%
-35,5840%
-27,2489%
400,0000%
-26,3771%
-113,139%
2.783,33%
100%
312,465%
100%
100%
690,551%
-25,168%
100%
100%
100%
100%
-64,589%
-64,589%
-96,486%
-96,126%
100%
100%
279,426%
-91,031%
100%
100%
-86,984%
318,023%
4,352
Leptocúrtica
4,029
Leptocúrtica
3,953
Leptocúrtica
3,794
Leptocúrtica
1,894
Leptocúrtica
10,756
Leptocúrtica
12,075
Leptocúrtica
9,940
Leptocúrtica
8,376
Leptocúrtica
7,340
Leptocúrtica
% MARTES
% MIÉRCOLES
% JUEVES
% VIERNES
% SÁBADO
% ENERO
% FEBRERO
% MARZO
% ABRIL
% MAYO
1,193
Platicúrtica
1,370
Platicúrtica
1,778
Platicúrtica
2,417
Platicúrtica
2,050
Platicúrtica
-1,277
Platicúrtica
-0,911
Platicúrtica
-0,827
Platicúrtica
-0,833
Platicúrtica
-0,734
Platicúrtica
-0,692
Platicúrtica
2,315
Asimetría
Positiva
4,478
Leptocúrtica
% LUNES
2,291
Asimetría
Positiva
2,224
Asimetría
Positiva
2,213
Asimetría
Positiva
2,173
Asimetría
Positiva
1,767
Asimetría
Positiva
3,352
Asimetría
Positiva
3,3518
Asimetría
Positiva
3,237
Asimetría
Positiva
3,023
Asimetría
Positiva
2,875
Asimetría
Positiva
-0,641
Platicúrtica
2,171
Asimetría
Positiva
3,600
Leptocúrtica
% DOMINGO
165
-83,7466%
-83,6437%
-82,1127%
-79,9834%
-80,9409%
-167,4234%
-124,0116%
-120,9208%
-120,6751%
-116,8658%
-115,4533%
1,019
Asimetría
Positiva
1,000
Asimetría
Positiva
0,953
Asimetría
Positiva
0,956
Asimetría
Positiva
0,915
Asimetría
Positiva
0,711
Asimetría
Positiva
1,915
Asimetría
Positiva
2,003
Asimetría
Positiva
1,850
Asimetría
Positiva
1,744
Asimetría
Positiva
1,699
Asimetría
Positiva
-117,8056%
1,054
Asimetría
Positiva
-40,9043%
-42,3090%
-42,8483%
-40,2411%
-42,8699%
-59,7623%
-57,8923%
-56,8007%
-57,1493%
-56,3509%
-55,9827%
-51,4509%
-59,128%
-64,183%
-69,819%
-75,155%
-72,109%
58,395%
-20,928%
-24,108%
-25,540%
-31,066%
-33,006%
-16,667%
100%
100%
100%
100%
100%
100%
100%
100%
100%
100%
100%
100%
2,048
Leptocúrtica
15,285
Leptocúrtica
14,561
Leptocúrtica
14,763
Leptocúrtica
12,477
Leptocúrtica
11,465
Leptocúrtica
5,554
Leptocúrtica
2609,098
Leptocúrtica
3407,819
Leptocúrtica
1921,114
Leptocúrtica
8609,157
Leptocúrtica
% JUNIO
% JULIO
% AGOSTO
% SEPTIEMBRE
% OCTUBRE
% NOVIEMBRE
% DICIEMBRE
PROMEDIO
DECLINACIÓN ($)
MONTO MÍNIMO ($)
MONTO MÁXIMO ($)
DESVIACIÓN ESTÁNDAR
($)
1,854
Asimetría
Positiva
3,922
Asimetría
Positiva
3,830
Asimetría
Positiva
3,852
Asimetría
Positiva
3,574
Asimetría
Positiva
3,446
Asimetría
Positiva
2,573
Asimetría
Positiva
32,976
Asimetría
Positiva
38,866
Asimetría
Positiva
27,726
Asimetría
Positiva
58,861
Asimetría
Positiva
-1,646
Platicúrtica
0,888
Platicúrtica
8,712
Leptocúrtica
1,213
Platicúrtica
0,401
Platicúrtica
2,354
Platicúrtica
2,718
Platicúrtica
3,528
Leptocúrtica
3,621
Leptocúrtica
4,037
Leptocúrtica
-0,878
Platicúrtica
166
0,957
Asimetría
Positiva
2,364
Asimetría
Positiva
2,277
Asimetría
Positiva
2,254
Asimetría
Positiva
2,077
Asimetría
Positiva
1,992
Asimetría
Positiva
1,457
Asimetría
Positiva
0,162
Asimetría
Positiva
-1,293
Asimetría
Negativa
-0,006
Asimetría
Negativa
-0,441
Asimetría
Negativa
-100,0191%
-99,9538%
-99,7444%
-99,9535%
-92,7800%
-79,4679%
-78,2159%
-76,1024%
-75,1322%
-73,5885%
-142,8711%
-100,7492%
-100,0216%
-103,3268%
-99,5087%
-43,3735%
-42,1938%
-41,8858%
-41,4849%
-40,5483%
-39,7246%
-48,3819%
-99,965%
-99,844%
-99,912%
-99,885%
-45,985%
-73,833%
-75,956%
-79,679%
-79,397%
-80,373%
46,484%
100%
100%
100%
100%
100%
100%
100%
100%
100%
100%
100%
VARIABLE: PROMEDIO DE DECLINACIÓN ($)
HISTOGRAMA DE FRECUENCIAS CON LA CURVA
NORMAL DE LA VARIABLE SIN TRANSFORMAR
167
HISTOGRAMA DE FRECUENCIAS CON LA CURVA
NORMAL DE LA VARIABLE TRANSFORMADA
A continuación se presenta, a manera de ejemplo, la comparación de dos variables significativas para evidenciar gráficamente la transformación obtenida
en la distribución de dichas variables (valores de curtosis y asimetría) luego de aplicar el log( + 1).
VARIABLE: # DE TRANSACCIONES DECLINADAS
168
-1,616
Platicúrtica
-0,218
Platicúrtica
5,046
Platicúrtica
0,920
Asimetría
Positiva
2,993
Asimetría
Positiva
251,144
Asimetría
Positiva
-0,560
Platicúrtica
14,664
Leptocúrtica
76.032,297
Leptocúrtica
RECENCY (meses)
ATIQUITY (años)
MONETIZE ($/año)
-1,777
Asimetría
Positiva
0,272
Asimetría
Positiva
0,428
Asimetría
Positiva
ASIMETRÍA
-99,99%
-101,49%
188,57%
CURTOSIS
-100,71%
-90,91%
-53,48%
ASIMETRÍA
VARIACIÓN
PORCENTUAL
-100,00%
-79,54%
-635,71%
CURTOSIS
-100,00%
-100,00%
-100,00%
ASIMETRÍA
VARIACIÓN IDEAL
CHECK
169
A continuación se presenta, a manera de ejemplo, la comparación de dos variables significativas para evidenciar gráficamente la transformación obtenida
en la distribución de dichas variables (valores de curtosis y asimetría) luego de aplicar el log( + 1).
CURTOSIS
VARIABLE
TRANSFORMADA
ASIMETRÍA
VARIABLE
VARIABLE INICIAL
BASE DE DATOS CON INFORMACIÓN DEL PRODUCTO DE TARJETA DE CRÉDITO
CURTOSIS
•
VARIABLE: RECENCY (meses)
HISTOGRAMA DE FRECUENCIAS CON LA CURVA
NORMAL DE LA VARIABLE SIN TRANSFORMAR
170
HISTOGRAMA DE FRECUENCIAS CON LA CURVA
NORMAL DE LA VARIABLE TRANSFORMADA
VARIABLE: ANTIQUITY (años)
171
VARIABLE: MONETIZE ($/año)
172
ANEXO G. Análisis Factorial.
i.
BASE AGRUPADA POR CLIENTE
A continuación se describe el proceso que se siguió a cabo para llevar a cabo el análisis factorial de las
variables incluidas en la base de datos agrupada por cliente.
•
Objetivos del Análisis Factorial
Para el presente estudio, el objetivo general del análisis factorial es determinar qué variables pueden ser
agrupadas y cuáles se pueden reducir para disminuir el número total de variables iniciales (30 variables).
•
Diseño del Análisis Factorial
La comprensión de la estructura de las variables requiere un análisis factorial de tipo R, es decir, el cálculo de
las correlaciones entre las variables y no entre los clientes, por lo que hace necesaria la matriz inicial de
correlaciones. Todas las variables que se incluirán en el análisis factorial son métricas y forman un conjunto
homogéneo apropiado para el análisis factorial. El tamaño de la muestra analizada es de 193.510 clientes, la
cual cumple con la condición de ser cinco (5) veces mayor que el número total de variables incluidas (30)
(Hair, 1999).
•
Supuestos del Análisis Factorial
Los supuestos estadísticos subyacentes al análisis factorial (normalidad, linealidad y homocedasticidad)
fueron analizados en el Anexo E del presente trabajo de grado.
Los resultados generados por el software PASW 18.0 indican el siguiente comportamiento en la matriz original
de datos.
-
Hay cierto grado de multicolinealidad.
-
Suficientes correlaciones para justificar el análisis factorial. Se puede concluir que la mayoría de las
correlaciones iniciales son mayores a 0,30 lo que indica que el análisis factorial es apropiado.
-
Las correlaciones parciales o anti-imagen menores indican que la matriz de datos es adecuada para
el análisis factorial.
La evaluación de la aplicación de factorial se presenta a continuación en el KMO y Prueba de Barllet. La
matriz de correlación, la inversa de la matriz de correlación y las matrices anti-imagen no se presentan en el
presente anexo por el tamaño que representan, dado el número total de las variables.
173
Los estadísticos correspondientes al estudio de la adecuación de la muestra al modelo, están representados a
través del KMO y la Prueba de Barllet.
La adecuación muestral a este análisis no resulta deseable, ya que la Medida de Adecuación Muestral de
Kaiser – Meyer – Olkin indica que la proporción de la varianza que tienen en común las variables, 0,362, está
un poco por debajo de 0,5 y no es muy cercana a ésta. Mediante la prueba de esfericidad de Barlett se puede
concluir que la significación de 0,000 indica que se puede rechazar la hipótesis nula de esfericidad, ya que
está por debajo del nivel crítico 0,05. Esto implica que las variables se ajustan correctamente al análisis
factorial (Bernal García, Martínez María- Dolores, & Sánchez García, 2003).
KMO y Prueba de Barllet.
Fuente: PASW 18.0.
•
Derivación de los factores y valoración del ajuste global
Una vez se tienen todas las correlaciones se procede a hallar las comunalidades de cada una de las
variables, la varianza total explicada y el gráfico de sedimentación. El método que se empleó para la
extracción de factores fue el de componentes principales, ya que el propósito general del análisis factorial fue
el de resumir la mayoría de la información original (varianza) en una mínima cantidad de factores con
propósitos de predicción (Hair, 1999).
Es importante aclarar que el uso de componentes principales sugiere las siguientes condiciones:
-
Basado en la varianza total. Estima los factores que contienen proporciones bajas de la varianza
única y en algunos casos la varianza de error. Se insertan las unidades en la diagonal de la matriz de
correlación para que se traiga la varianza completa en la matriz de factores.
-
Se usa con el fin de predecir o disminuir el número de factores.
A continuación se presentan los resultados obtenidos con la ayuda del software PASW 18.0.
Comunalidades
174
175
Varianza total explicada
Fuente: PASW 18.0.
176
Gráfico de sedimentación
Fuente: PASW 18.0.
De lo anterior se puede concluir que el modelo sugiere que se tengan en cuenta 14 factores. Sin embargo, el
gráfico de sedimentación indica que la diferencia entre los primeros 14 factores y los restantes no es
concluyente, por lo que se decidió no tener en cuenta los factores sugeridos por el análisis factorial.
•
Interpretación de los factores
A continuación se presenta la matriz que describe las variables en cada uno de los componentes sugeridos.
177
Fuente: PASW 18.0.
Los 14 factores sugeridos describen el 64,811% de la población inicial.
•
Rotación de los factores
Finalmente se rotó la matriz de factores obtenida para distribuir la varianza de los primeros factores a los
últimos, con el fin de lograr un patrón de factores más simple y teóricamente más significativo. Se utilizó el
software PASW 18.0 y se rotaron los factores de acuerdo con el criterio Varimax. A continuación se ilustran
gráficamente los resultados obtenidos.
Fuente: PASW 18.0.
En general, después de realizar el análisis factorial se puede concluir que aunque no se van a tener en cuenta
los 14 factores sugeridos, se van a eliminar las siguientes variables del estudio: Monto Total Declinado, Monto
Mínimo, Monto Máximo, % Visa Internacional y % Master Internacional.
178
ii.
BASE CON INFORMACIÓN DEL PRODUCTO DE TARJETA DE CRÉDITO
A continuación se describe el proceso que se siguió a cabo para llevar a cabo el análisis factorial de las
variables incluidas en la base de datos con información del producto de tarjeta de crédito.
•
Objetivos del Análisis Factorial
Para el presente estudio, el objetivo general del análisis factorial es determinar qué variables pueden ser
agrupadas y cuáles se pueden reducir para disminuir el número total de variables iniciales (3 variables).
•
Diseño del Análisis Factorial
La comprensión de la estructura de las variables requiere un análisis factorial de tipo R, es decir, el cálculo de
las correlaciones entre las variables y no entre los clientes, por lo que hace necesaria la matriz inicial de
correlaciones. Todas las variables que se incluirán en el análisis factorial son métricas y forman un conjunto
homogéneo apropiado para el análisis factorial. El tamaño de la muestra analizada es de 185.268 clientes, la
cual cumple con la condición de ser cinco (5) veces mayor que el número total de variables incluidas (30)
(Hair, 1999).
•
Supuestos del Análisis Factorial
Los supuestos estadísticos subyacentes al análisis factorial (normalidad, linealidad y homocedasticidad)
fueron analizados en el Anexo E del presente trabajo de grado.
Los resultados generados por el software PASW 18.0 indican el siguiente comportamiento en la matriz original
de datos.
-
Hay cierto grado de multicolinealidad.
-
Suficientes correlaciones para justificar el análisis factorial. Se puede concluir que la mayoría de las
correlaciones iniciales son mayores a 0,30 lo que indica que el análisis factorial es apropiado.
-
Las correlaciones parciales o anti-imagen menores indican que la matriz de datos es adecuada para
el análisis factorial.
La evaluación de la aplicación de factorial se presenta a continuación en el KMO y Prueba de Barllet, junto
con la matriz de correlación, la inversa de la matriz de correlación y las matrices anti-imagen.
Matriz de correlaciones.
179
Fuente: PASW 18.0.
Inversa de la matriz de correlaciones.
Fuente: PASW 18.0.
KMO y prueba de Barlett.
Fuente: PASW 18.0.
Matriz anti-imagen
Fuente: PASW 18.0.
180
Los estadísticos correspondientes al estudio de la adecuación de la muestra al modelo, están representados a
través del KMO y la Prueba de Barllet. La adecuación muestral a este análisis resulta deseable, ya que la
Medida de Adecuación Muestral de Kaiser – Meyer – Olkin indica que la proporción de la varianza que tienen
en común las variables, 0,490, que aunque está un poco por debajo de 0,5 y es muy cercana a ésta. Mediante
la prueba de esfericidad de Barlett se puede concluir que la significación de 0,000 indica que se puede
rechazar la hipótesis nula de esfericidad, ya que está por debajo del nivel crítico 0,05. Esto implica que las
variables se ajustan correctamente al análisis factorial (Bernal García, Martínez María- Dolores, & Sánchez
García, 2003).
•
Derivación de los factores y valoración del ajuste global
Una vez se tienen todas las correlaciones se procede a hallar las comunalidades de cada una de las
variables, la varianza total explicada y el gráfico de sedimentación. El método que se empleó para la
extracción de factores fue el de componentes principales, ya que el propósito general del análisis factorial fue
el de resumir la mayoría de la información original (varianza) en una mínima cantidad de factores con
propósitos de predicción (Hair, 1999).
Es importante aclarar que el uso de componentes principales sugiere las siguientes condiciones:
-
Basado en la varianza total. Estima los factores que contienen proporciones bajas de la varianza
única y en algunos casos la varianza de error. Se insertan las unidades en la diagonal de la matriz de
correlación para que se traiga la varianza completa en la matriz de factores.
-
Se usa con el fin de predecir o disminuir el número de factores.
A continuación se presentan los resultados obtenidos con la ayuda del software PASW 18.0.
Comunalidades
Fuente: PASW 18.0.
Varianza total explicada
181
Fuente: PASW 18.0.
Gráfico de sedimentación
Fuente: PASW 18.0.
De lo anterior se puede concluir que el modelo sugiere que se tengan en cuenta 2 factores
•
Interpretación de los factores
A continuación se presenta la matriz que describe las variables en cada uno de los componentes sugeridos.
Fuente: PASW 18.0.
182
Los 14 factores sugeridos describen el 76,486% de la población inicial.
•
Rotación de los factores
Finalmente se rotó la matriz de factores obtenida para distribuir la varianza de los primeros factores a los
últimos, con el fin de lograr un patrón de factores más simple y teóricamente más significativo. Se utilizó el
software PASW 18.0 y se rotaron los factores de acuerdo con el criterio Varimax. A continuación se ilustran
gráficamente los resultados obtenidos.
Fuente: PASW 18.0.
En general, después de realizar el análisis factorial se puede concluir que aunque no se van a tener en cuenta
los 2 factores sugeridos, se va a trabajar con todas las variables incluidas en la base con información de
tarjeta de crédito.
183
ANEXO H. Análisis de varianza con un sólo factor (análisis de 1- )
El análisis de varianza se realiza para comparar el número de grupos (entre cinco y quince) y la distancia de
cada caso al centro del clúster. Lo anterior con el fin de determinar cuál es el número óptimo de grupos a
tener en cuenta para realizar el conglomerado de K medias. Lo que se busca es determinar el número de
grupos que tenga, en promedio, la distancia más baja al centro del clúster. Este análisis estadístico fue
realizado con la ayuda del software PASW Statistics 18.0.
El proceso que se llevo a cabo consistió en tres pasos: (i) Correr las soluciones de los conglomerados de K
medias entre cinco y quince grupos, (ii) guardar en dos variables (para cada uno de los números de grupos) la
distancia al centro del clúster y el conglomerado de pertenencia, (iii) correr el ANOVA con la ayuda del
software PASW Statistics 18.0, tomando como variable nominal independiente el número de grupos y la
variable escalar dependiente la distancia al centro del clúster.
i.
ANOVA PARA CINCO GRUPOS
Fuente: PASW 18.0
En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o
valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son
homogéneas. Si ello es así, se puede proceder con el análisis de varianza.
Fuente: PASW 18.0
La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente
(grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La
sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de
las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo
un bajo riesgo de cometer una equivocación.
184
La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 5 niveles
del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o
desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para
contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de
confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 4 y 5 son significativamente
diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000, menor que 0,05).
Distancia del caso desde su centro inicial de clasificación
Scheffé
(I) Número inicial de
casos
1
2
3
4
5
(J) Número inicial de
casos
2
3
4
5
1
3
4
5
1
2
4
5
1
2
3
5
1
2
3
4
Diferencia
de medias
(I-J)
Error típico
Sig.
-,24967485
-,28305130
,07020341
,03271798
,24967485
-,03337645
,31987826
,28239283
,28305130
,03337645
,35325471
,31576928
-,07020341
-,31987826
-,35325471
-,03748543
-,03271798
-,28239283
-,31576928
,03748543
,00281614
,00304865
,00277810
,00303114
,00281614
,00332328
,00307697
,00330723
,00304865
,00332328
,00329110
,00350733
,00277810
,00307697
,00329110
,00327490
,00303114
,00330723
,00350733
,00327490
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
Intervalo de confianza al
95%
Límite
Límite
inferior
superior
-,2583493
-,2410004
-,2924419
-,2736607
,0616462
,0787606
,0233813
,0420547
,2410004
,2583493
-,0436130
-,0231399
,3104004
,3293561
,2722058
,2925799
,2736607
,2924419
,0231399
,0436130
,3431173
,3633921
,3049659
,3265727
-,0787606
-,0616462
-,3293561
-,3104004
-,3633921
-,3431173
-,0475729
-,0273979
-,0420547
-,0233813
-,2925799
-,2722058
-,3265727
-,3049659
,0273979
,0475729
Fuente: PASW 18.0
Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del
tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable
dependiente. Aquí se observa claramente que en todos los grupos las medias difieren entre sí.
185
Fuente: PASW 18.0
ii.
ANOVA PARA SEIS GRUPOS
Fuente: PASW 18.0
En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o
valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son
homogéneas. Si ello es así, se puede proceder con el análisis de varianza.
Fuente: PASW 18.0
La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente
(grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La
sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de
186
las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo
un bajo riesgo de cometer una equivocación.
La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 6 niveles
del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o
desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para
contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de
confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 4, 5 y 6 son
significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000, menor
que 0,05).
Distancia del caso desde su centro inicial de clasificación
Scheffé
(I) Número inicial de
casos
1
2
3
4
5
(J) Número inicial de
casos
2
3
4
5
6
1
3
4
5
6
1
2
4
5
6
1
2
3
5
6
1
2
Diferencia
de medias
(I-J)
Error típico
Sig.
,09480648
-,25877727
-,03097640
-,15375067
,31313800
-,09480648
-,35358375
-,12578288
-,24855715
,21833152
,25877727
,35358375
,22780087
,10502660
,57191527
,03097640
,12578288
-,22780087
-,12277427
,34411440
,15375067
,24855715
,00278896
,00475708
,00276466
,00297280
,00279649
,00278896
,00482449
,00287911
,00307953
,00290969
,00475708
,00482449
,00481049
,00493305
,00482885
,00276466
,00287911
,00481049
,00305754
,00288640
,00297280
,00307953
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
187
Intervalo de confianza al
95%
Límite
Límite
inferior
superior
,0855269
,1040861
-,2746054
-,2429492
-,0401752
-,0217776
-,1636420
-,1438594
,3038333
,3224427
-,1040861
-,0855269
-,3696361
-,3375314
-,1353625
-,1162033
-,2588036
-,2383107
,2086502
,2280128
,2429492
,2746054
,3375314
,3696361
,2117951
,2438067
,0886130
,1214402
,5558484
,5879822
,0217776
,0401752
,1162033
,1353625
-,2438067
-,2117951
-,1329475
-,1126010
,3345106
,3537182
,1438594
,1636420
,2383107
,2588036
6
3
4
6
1
2
3
4
5
-,10502660
,12277427
,46688867
-,31313800
-,21833152
-,57191527
-,34411440
-,46688867
,00493305
,00305754
,00308634
,00279649
,00290969
,00482885
,00288640
,00308634
,000
,000
,000
,000
,000
,000
,000
,000
-,1214402
,1126010
,4566196
-,3224427
-,2280128
-,5879822
-,3537182
-,4771578
-,0886130
,1329475
,4771578
-,3038333
-,2086502
-,5558484
-,3345106
-,4566196
Fuente: PASW 18.0
Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del
tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable
dependiente. Aquí se observa claramente que en todos los grupos las medias difieren entre sí.
Fuente: PASW 18.0
iii.
ANOVA PARA SIETE GRUPOS
Fuente: PASW 18.0
188
En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o
valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son
homogéneas. Si ello es así, se puede proceder con el análisis de varianza.
Fuente: PASW 18.0
La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente
(grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La
sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de
las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo
un bajo riesgo de cometer una equivocación.
La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 7 niveles
del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o
desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para
contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de
confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 4, 5, 6 y 7 son
significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000, menor
que 0,05).
Distancia del caso desde su centro inicial de clasificación
Scheffé
(I) Número inicial de
casos
1
(J) Número inicial de
casos
2
3
4
5
Intervalo de confianza al
95%
Diferencia
de medias
(I-J)
Error típico
Sig.
-,36131324
-,31769316
-,42250743
-,06573357
,00390046
,00312993
,03372667
,00345666
,000
,000
,000
,000
189
Límite
inferior
Límite
superior
-,3751540
-,3287997
-,5421866
-,0779995
-,3474725
-,3065866
-,3028283
-,0534676
2
3
4
5
6
7
6
7
1
3
4
5
6
7
1
2
4
5
6
7
1
2
3
5
6
7
1
2
3
4
6
7
1
2
3
4
5
7
1
2
3
4
5
6
-,12836331
-,14823419
,36131324
,04362008
-,06119419
,29557967
,23294993
,21307905
,31769316
-,04362008
-,10481426
,25195959
,18932985
,16945897
,42250743
,06119419
,10481426
,35677385
,29414411
,27427324
,06573357
-,29557967
-,25195959
-,35677385
-,06262974
-,08250062
,12836331
-,23294993
-,18932985
-,29414411
,06262974
-,01987087
,14823419
-,21307905
-,16945897
-,27427324
,08250062
,01987087
Fuente: PASW 18.0
190
,00380393
,00292188
,00390046
,00380693
,03379622
,00407980
,00437792
,00363780
,00312993
,00380693
,03371598
,00335078
,00370797
,00279581
,03372667
,03379622
,03371598
,03374788
,03378521
,03369730
,00345666
,00407980
,00335078
,03374788
,00398762
,00315731
,00380393
,00437792
,00370797
,03378521
,00398762
,00353411
,00292188
,00363780
,00279581
,03369730
,00315731
,00353411
,000
,000
,000
,000
,773
,000
,000
,000
,000
,000
,140
,000
,000
,000
,000
,773
,140
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
-,1418616
-,1586025
,3474725
,0301112
-,1811201
,2811025
,2174149
,2001703
,3065866
-,0571290
-,2244555
,2400694
,1761721
,1595380
,3028283
-,0587318
-,0148270
,2370194
,1742572
,1546983
,0534676
-,3100569
-,2638498
-,4765283
-,0767798
-,0937043
,1148651
-,2484850
-,2024876
-,4140310
,0484797
-,0324117
,1378659
-,2259878
-,1793799
-,3938482
,0712969
,0073301
-,1148651
-,1378659
,3751540
,0571290
,0587318
,3100569
,2484850
,2259878
,3287997
-,0301112
,0148270
,2638498
,2024876
,1793799
,5421866
,1811201
,2244555
,4765283
,4140310
,3938482
,0779995
-,2811025
-,2400694
-,2370194
-,0484797
-,0712969
,1418616
-,2174149
-,1761721
-,1742572
,0767798
-,0073301
,1586025
-,2001703
-,1595380
-,1546983
,0937043
,0324117
Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del
tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable
dependiente. En este caso, se observa que los grupos 3 y 2 no son significativamente diferentes (“valor p”
mínimo= 0.459). Aquí se observa claramente que los únicos grupos cuyas medias difieren entre sí son: 1, 5,
7, 3 y 4.
Fuente: PASW 18.0
iv.
ANOVA PARA OCHO GRUPOS
Fuente: PASW 18.0
En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o
valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son
homogéneas. Si ello es así, se puede proceder con el análisis de varianza.
191
Fuente: PASW 18.0
La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente
(grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La
sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de
las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo
un bajo riesgo de cometer una equivocación.
La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 8 niveles
del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o
desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para
contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de
confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 4, 5, 6, 7 y 8 son
significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000 y para
el 6 = 0,494, menor que 0,05).
Distancia del caso desde su centro inicial de clasificación
Scheffé
(I) Número inicial de
casos
1
2
(J) Número inicial de
casos
2
3
4
5
6
7
8
1
3
4
Diferencia
de medias
(I-J)
Error típico
Sig.
-,07210605
,30756200
,09017580
,11089586
,02709080
,34013025
,11402224
,07210605
,37966805
,16228186
,01081169
,01123468
,01442157
,01088419
,01071274
,01096915
,01336164
,01081169
,00475356
,01021567
,000
,000
,000
,000
,494
,000
,000
,000
,000
,000
192
Intervalo de confianza al
95%
Límite
Límite
inferior
superior
-,1126570
-,0315551
,2654245
,3496995
,0360854
,1442662
,0700729
,1517188
-,0130891
,0672707
,2989887
,3812718
,0639072
,1641372
,0315551
,1126570
,3618390
,3974971
,1239663
,2005974
3
4
5
6
7
8
5
6
7
8
1
2
4
5
6
7
8
1
2
3
5
6
7
8
1
2
3
4
6
7
8
1
2
3
4
5
7
8
1
2
3
4
5
6
8
1
,18300191
,09919685
,41223631
,18612830
-,30756200
-,37966805
-,21738620
-,19666614
-,28047120
,03256825
-,19353975
-,09017580
-,16228186
,21738620
,02072006
-,06308500
,24995445
,02384644
-,11089586
-,18300191
,19666614
-,02072006
-,08380506
,22923439
,00312639
-,02709080
-,09919685
,28047120
,06308500
,08380506
,31303945
,08693144
-,34013025
-,41223631
-,03256825
-,24995445
-,22923439
-,31303945
-,22610801
-,11402224
193
,00385276
,00333782
,00408663
,00865515
,01123468
,00475356
,01066233
,00491622
,00452400
,00510157
,00917808
,01442157
,01021567
,01066233
,01029237
,01011089
,01038218
,01288412
,01088419
,00385276
,00491622
,01029237
,00356567
,00427475
,00874554
,01071274
,00333782
,00452400
,01011089
,00356567
,00381717
,00853123
,01096915
,00408663
,00510157
,01038218
,00427475
,00381717
,00885106
,01336164
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,774
,000
,000
,843
,000
,000
,000
,774
,000
,000
1,000
,494
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,1685515
,0866778
,3969087
,1536658
-,3496995
-,3974971
-,2573770
-,2151052
-,2974392
,0134340
-,2279636
-,1442662
-,2005974
,1773954
-,0178831
-,1010075
,2110144
-,0244776
-,1517188
-,1974523
,1782270
-,0593232
-,0971787
,2132013
-,0296752
-,0672707
-,1117159
,2635032
,0251625
,0704314
,2987225
,0549337
-,3812718
-,4275639
-,0517025
-,2888945
-,2452675
-,3273564
-,2593054
-,1641372
,1974523
,1117159
,4275639
,2185908
-,2654245
-,3618390
-,1773954
-,1782270
-,2635032
,0517025
-,1591159
-,0360854
-,1239663
,2573770
,0593232
-,0251625
,2888945
,0721704
-,0700729
-,1685515
,2151052
,0178831
-,0704314
,2452675
,0359280
,0130891
-,0866778
,2974392
,1010075
,0971787
,3273564
,1189292
-,2989887
-,3969087
-,0134340
-,2110144
-,2132013
-,2987225
-,1929107
-,0639072
2
3
4
5
6
7
-,18612830
,19353975
-,02384644
-,00312639
-,08693144
,22610801
,00865515
,00917808
,01288412
,00874554
,00853123
,00885106
,000
,000
,843
1,000
,000
,000
-,2185908
,1591159
-,0721704
-,0359280
-,1189292
,1929107
-,1536658
,2279636
,0244776
,0296752
-,0549337
,2593054
Fuente: PASW 18.0
Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del
tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable
dependiente. En este caso, se observa que los grupos 7 y 3 no son significativamente diferentes (“valor p”
mínimo= 0.68). Aquí se observa claramente que en todos los grupos las medias difieren entre sí.
Fuente: PASW 18.0
v.
ANOVA PARA NUEVE GRUPOS
Fuente: PASW 18.0
194
En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o
valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son
homogéneas. Si ello es así, se puede proceder con el análisis de varianza.
Fuente: PASW 18.0
La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente
(grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La
sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de
las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo
un bajo riesgo de cometer una equivocación.
La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 9 niveles
del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o
desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para
contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de
confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 4, 5, 6, 8 y 9 son
significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000, menor
que 0,05) y en cambio el grupo 7 no es significativamente diferente entre sí (“valor p”=1,000 mucho mayor
que 0,05).
Distancia del caso desde su centro inicial de clasificación
Scheffé
(I) Número inicial de
casos
1
(J) Número inicial de
casos
2
3
4
5
6
Diferencia
de medias
(I-J)
Error típico
Sig.
,17655980
-,21556447
-,08136093
-,09950884
,14066699
,00441167
,00448566
,00421864
,00483387
,00458274
,000
,000
,000
,000
,000
195
Intervalo de confianza al
95%
Límite
inferior
Límite
superior
,1591867
-,2332289
-,0979738
-,1185445
,1226202
,1939329
-,1979000
-,0647480
-,0804731
,1587137
2
3
4
5
6
7
8
9
1
3
4
5
6
7
8
9
1
2
4
5
6
7
8
9
1
2
3
5
6
7
8
9
1
2
3
4
6
7
8
9
1
2
3
4
5
,00216948
,20595391
-,39396122
-,17655980
-,39212428
-,25792073
-,27606864
-,03589281
-,17439032
,02939410
-,57052102
,21556447
,39212428
,13420354
,11605564
,35623147
,21773396
,42151838
-,17839674
,08136093
,25792073
-,13420354
-,01814791
,22202792
,08353041
,28731484
-,31260029
,09950884
,27606864
-,11605564
,01814791
,24017583
,10167832
,30546274
-,29445238
-,14066699
,03589281
-,35623147
-,22202792
-,24017583
196
,00484788
,00425117
,00573697
,00441167
,00355165
,00320780
,00398238
,00367349
,00399938
,00325047
,00504043
,00448566
,00355165
,00330882
,00406420
,00376203
,00408085
,00335020
,00510532
,00421864
,00320780
,00330882
,00376742
,00343928
,00378538
,00298322
,00487237
,00483387
,00398238
,00406420
,00376742
,00417110
,00446077
,00380382
,00541381
,00458274
,00367349
,00376203
,00343928
,00417110
1,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,003
,000
,000
,000
,000
,000
,000
,000
,003
,000
,000
,000
,000
,000
,000
,000
,000
,000
-,0169214
,1892129
-,4165533
-,1939329
-,4061106
-,2705530
-,2917512
-,0503590
-,1901398
,0165938
-,5903701
,1979000
,3781379
,1211735
,1000509
,3414166
,2016636
,4083253
-,1985014
,0647480
,2452885
-,1472336
-,0329839
,2084841
,0686237
,2755670
-,3317876
,0804731
,2603861
-,1320604
,0033119
,2237501
,0841119
,2904834
-,3157719
-,1587137
,0214267
-,3710463
-,2355717
-,2566015
,0212604
,2226949
-,3713691
-,1591867
-,3781379
-,2452885
-,2603861
-,0214267
-,1586409
,0421944
-,5506719
,2332289
,4061106
,1472336
,1320604
,3710463
,2338043
,4347114
-,1582921
,0979738
,2705530
-,1211735
-,0033119
,2355717
,0984372
,2990627
-,2934130
,1185445
,2917512
-,1000509
,0329839
,2566015
,1192448
,3204421
-,2731329
-,1226202
,0503590
-,3414166
-,2084841
-,2237501
7
8
9
7
8
9
1
2
3
4
5
6
8
9
1
2
3
4
5
6
7
9
1
2
3
4
5
6
7
8
-,13849751
,06528691
-,53462821
-,00216948
,17439032
-,21773396
-,08353041
-,10167832
,13849751
,20378442
-,39613070
-,20595391
-,02939410
-,42151838
-,28731484
-,30546274
-,06528691
-,20378442
-,59991512
,39396122
,57052102
,17839674
,31260029
,29445238
,53462821
,39613070
,59991512
,00418732
,00347911
,00519082
,00484788
,00399938
,00408085
,00378538
,00446077
,00418732
,00382160
,00542633
,00425117
,00325047
,00335020
,00298322
,00380382
,00347911
,00382160
,00490057
,00573697
,00504043
,00510532
,00487237
,00541381
,00519082
,00542633
,00490057
,000
,000
,000
1,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
-,1549871
,0515862
-,5550695
-,0212604
,1586409
-,2338043
-,0984372
-,1192448
,1220079
,1887350
-,4174995
-,2226949
-,0421944
-,4347114
-,2990627
-,3204421
-,0789876
-,2188338
-,6192135
,3713691
,5506719
,1582921
,2934130
,2731329
,5141869
,3747619
,5806168
-,1220079
,0789876
-,5141869
,0169214
,1901398
-,2016636
-,0686237
-,0841119
,1549871
,2188338
-,3747619
-,1892129
-,0165938
-,4083253
-,2755670
-,2904834
-,0515862
-,1887350
-,5806168
,4165533
,5903701
,1985014
,3317876
,3157719
,5550695
,4174995
,6192135
Fuente: PASW 18.0
Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del
tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable
dependiente. Aquí se observa claramente que en todos los grupos las medias difieren entre sí.
197
Fuente: PASW 18.0
vi.
ANOVA PARA DIEZ GRUPOS
Fuente: PASW 18.0
En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o
valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son
homogéneas. Si ello es así, se puede proceder con el análisis de varianza.
Fuente: PASW 18.0
198
La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente
(grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La
sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de
las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo
un bajo riesgo de cometer una equivocación.
La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 10 niveles
del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o
desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para
contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de
confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 5, 6, 7, 8 y 9 son
significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000, menor
que 0,05) y en cambio el grupo 4 no es significativamente diferente entre sí (“valor p”=0.999, mucho mayor
que 0,05).
Distancia del caso desde su centro inicial de clasificación
Scheffé
(I) Número inicial de
casos
1
2
(J) Número inicial de
casos
2
3
4
5
6
7
8
9
10
1
3
4
5
6
7
8
9
10
Intervalo de confianza al
95%
Diferencia
de medias
(I-J)
Error típico
Sig.
-,35586433
-,26638702
,00583677
-,05192432
-,28109225
-,03695077
-,06997152
-,37948642
-,09765198
,35586433
,08947732
,36170110
,30394002
,07477209
,31891357
,28589281
-,02362208
,25821236
,01157446
,00936223
,00567387
,00527876
,01088198
,00495723
,00568725
,00483893
,00607105
,01157446
,01369041
,01148777
,01129784
,01477137
,01115124
,01149438
,01109915
,01168904
,000
,000
,999
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,002
,000
,000
,873
,000
199
Límite
inferior
Límite
superior
-,4034738
-,3048969
-,0175017
-,0736375
-,3258533
-,0573415
-,0933650
-,3993905
-,1226242
,3082549
,0331643
,3144482
,2574684
,0140127
,2730449
,2386127
-,0692765
,2101316
-,3082549
-,2278772
,0291752
-,0302111
-,2363312
-,0165601
-,0465781
-,3595824
-,0726798
,4034738
,1457904
,4089540
,3504117
,1355315
,3647822
,3331729
,0220323
,3062931
3
4
5
6
7
1
2
4
5
6
7
8
9
10
1
2
3
5
6
7
8
9
10
1
2
3
4
6
7
8
9
10
1
2
3
4
5
7
8
9
10
1
2
3
4
,26638702
-,08947732
,27222379
,21446270
-,01470523
,22943625
,19641549
-,11309940
,16873504
-,00583677
-,36170110
-,27222379
-,05776109
-,28692902
-,04278754
-,07580829
-,38532319
-,10348875
,05192432
-,30394002
-,21446270
,05776109
-,22916793
,01497355
-,01804720
-,32756210
-,04572766
,28109225
-,07477209
,01470523
,28692902
,22916793
,24414148
,21112072
-,09839417
,18344027
,03695077
-,31891357
-,22943625
,04278754
200
,00936223
,01369041
,00925484
,00901801
,01311017
,00883365
,00926304
,00876780
,00950352
,00567387
,01148777
,00925484
,00508585
,01078972
,00475129
,00550867
,00462772
,00590409
,00527876
,01129784
,00901801
,00508585
,01058728
,00427168
,00510077
,00413379
,00552546
,01088198
,01477137
,01311017
,01078972
,01058728
,01043070
,01079676
,01037499
,01100377
,00495723
,01115124
,00883365
,00475129
,000
,000
,000
,000
,999
,000
,000
,000
,000
,999
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,198
,186
,000
,000
,000
,002
,999
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,2278772
-,1457904
,2341557
,1773687
-,0686316
,1931006
,1583136
-,1491642
,1296440
-,0291752
-,4089540
-,3102919
-,0786808
-,3313106
-,0623311
-,0984672
-,4043585
-,1277742
,0302111
-,3504117
-,2515567
,0368414
-,2727168
-,0025972
-,0390283
-,3445657
-,0684556
,2363312
-,1355315
-,0392211
,2425474
,1856190
,2012367
,1667102
-,1410698
,1381782
,0165601
-,3647822
-,2657719
,0232439
,3048969
-,0331643
,3102919
,2515567
,0392211
,2657719
,2345174
-,0770346
,2078261
,0175017
-,3144482
-,2341557
-,0368414
-,2425474
-,0232439
-,0531494
-,3662879
-,0792033
,0736375
-,2574684
-,1773687
,0786808
-,1856190
,0325443
,0029339
-,3105585
-,0229997
,3258533
-,0140127
,0686316
,3313106
,2727168
,2870463
,2555313
-,0557185
,2287023
,0573415
-,2730449
-,1931006
,0623311
8
9
10
5
6
8
9
10
1
2
3
4
5
6
7
9
10
1
2
3
4
5
6
7
8
10
1
2
3
4
5
6
7
8
9
-,01497355
-,24414148
-,03302076
-,34253565
-,06070121
,06997152
-,28589281
-,19641549
,07580829
,01804720
-,21112072
,03302076
-,30951489
-,02768045
,37948642
,02362208
,11309940
,38532319
,32756210
,09839417
,34253565
,30951489
,28183444
,09765198
-,25821236
-,16873504
,10348875
,04572766
-,18344027
,06070121
,02768045
-,28183444
,00427168
,01043070
,00476726
,00371446
,00521916
,00568725
,01149438
,00926304
,00550867
,00510077
,01079676
,00476726
,00464411
,00591694
,00483893
,01109915
,00876780
,00462772
,00413379
,01037499
,00371446
,00464411
,00510692
,00607105
,01168904
,00950352
,00590409
,00552546
,01100377
,00521916
,00591694
,00510692
,198
,000
,000
,000
,000
,000
,000
,000
,000
,186
,000
,000
,000
,009
,000
,873
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,009
,000
-,0325443
-,2870463
-,0526300
-,3578144
-,0821693
,0465781
-,3331729
-,2345174
,0531494
-,0029339
-,2555313
,0134115
-,3286176
-,0520187
,3595824
-,0220323
,0770346
,3662879
,3105585
,0557185
,3272569
,2904122
,2608280
,0726798
-,3062931
-,2078261
,0792033
,0229997
-,2287023
,0392331
,0033422
-,3028409
,0025972
-,2012367
-,0134115
-,3272569
-,0392331
,0933650
-,2386127
-,1583136
,0984672
,0390283
-,1667102
,0526300
-,2904122
-,0033422
,3993905
,0692765
,1491642
,4043585
,3445657
,1410698
,3578144
,3286176
,3028409
,1226242
-,2101316
-,1296440
,1277742
,0684556
-,1381782
,0821693
,0520187
-,2608280
Fuente: PASW 18.0.
Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del
tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable
dependiente. Se observa que los grupos 7, 5 y 8 no son significativamente diferentes (“valor p” mínimo α =
201
0.111). Aquí se observa más claramente que los únicos grupos de ventas cuyas medias difieren entre sí son;
4, 1, 7, 5, 10, 3, 6, 2 y 9.
Fuente: PASW 18.0.
vii.
ANOVA PARA ONCE GRUPOS
Fuente: PASW 18.0.
En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o
valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son
homogéneas. Si ello es así, se puede proceder con el análisis de varianza.
202
Fuente: PASW 18.0.
La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente
(grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La
sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de
las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo
un bajo riesgo de cometer una equivocación.
La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 11 niveles
del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o
desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para
contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de
confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 5, 6, 7, 8 y 9 son
significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000, menor
que 0,05) y en cambio el grupo 4 no es significativamente diferente entre sí (“valor p”=0.999, mucho mayor
que 0,05).
Distancia del caso desde su centro inicial de clasificación
Scheffé
(I) Número inicial de
casos
1
(J) Número inicial de
casos
2
3
4
5
6
7
8
9
10
Diferencia
de medias
(I-J)
Error típico
Sig.
-,19947467
,15671107
,00440566
,26872896
-,33513071
-,21662483
-,12612412
-,06713926
-,17449368
,00637974
,00425677
,00416451
,00395955
,03011261
,00632378
,00431101
,00365781
,00390925
,000
,000
1,000
,000
,000
,000
,000
,000
,000
203
Intervalo de confianza al
95%
Límite
inferior
Límite
superior
-,2267718
,1384975
-,0134131
,2517871
-,4639744
-,2436826
-,1445698
-,0827900
-,1912203
-,1721775
,1749246
,0222245
,2856708
-,2062870
-,1895671
-,1076785
-,0514885
-,1577671
2
3
4
5
11
1
3
4
5
6
7
8
9
10
11
1
2
4
5
6
7
8
9
10
11
1
2
3
5
6
7
8
9
10
11
1
2
3
4
6
7
8
9
10
,18192185
,19947467
,35618574
,20388033
,46820363
-,13565603
-,01715015
,07335056
,13233541
,02498100
,38139653
-,15671107
-,35618574
-,15230541
,11201789
-,49184178
-,37333590
-,28283519
-,22385033
-,33120475
,02521078
-,00440566
-,20388033
,15230541
,26432330
-,33953637
-,22103048
-,13052977
-,07154492
-,17889933
,17751620
-,26872896
-,46820363
-,11201789
-,26432330
-,60385967
-,48535378
-,39485307
-,33586822
-,44322263
204
,00365707
,00637974
,00632439
,00626266
,00612828
,03047371
,00786563
,00636103
,00593779
,00609591
,00593734
,00425677
,00632439
,00407922
,00386974
,03010093
,00626794
,00422867
,00356040
,00381826
,00355964
,00416451
,00626266
,00407922
,00376801
,03008803
,00620565
,00413578
,00344956
,00371512
,00344878
,00395955
,00612828
,00386974
,00376801
,03006034
,00607001
,00392933
,00319912
,00348383
,000
,000
,000
,000
,000
,031
,907
,000
,000
,079
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
1,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,1662742
,1721775
,3291254
,1770841
,4419824
-,2660448
-,0508050
,0461335
,1069292
-,0011017
,3559923
-,1749246
-,3832461
-,1697593
,0954603
-,6206355
-,4001547
-,3009285
-,2390843
-,3475421
,0099800
-,0222245
-,2306766
,1348516
,2482010
-,4682749
-,2475828
-,1482257
-,0863047
-,1947953
,1627598
-,2856708
-,4944249
-,1285755
-,2804456
-,7324797
-,5113257
-,4116656
-,3495564
-,4581290
,1975695
,2267718
,3832461
,2306766
,4944249
-,0052673
,0165047
,1005677
,1577416
,0510637
,4068008
-,1384975
-,3291254
-,1348516
,1285755
-,3630480
-,3465171
-,2647418
-,2086163
-,3148674
,0404415
,0134131
-,1770841
,1697593
,2804456
-,2107978
-,1944782
-,1128339
-,0567852
-,1630033
,1922726
-,2517871
-,4419824
-,0954603
-,2482010
-,4752396
-,4593818
-,3780405
-,3221800
-,4283163
6
7
8
9
11
1
2
3
4
5
7
8
9
10
11
1
2
3
4
5
6
8
9
10
11
1
2
3
4
5
6
7
9
10
11
1
2
3
4
5
6
7
8
10
-,08680710
,33513071
,13565603
,49184178
,33953637
,60385967
,11850588
,20900659
,26799145
,16063703
,51705256
,21662483
,01715015
,37333590
,22103048
,48535378
-,11850588
,09050071
,14948557
,04213115
,39854668
,12612412
-,07335056
,28283519
,13052977
,39485307
-,20900659
-,09050071
,05898486
-,04836956
,30804597
,06713926
-,13233541
,22385033
,07154492
,33586822
-,26799145
-,14948557
-,05898486
-,10735442
205
,00319828
,03011261
,03047371
,03010093
,03008803
,03006034
,03046205
,03010865
,03002209
,03005376
,03002200
,00632378
,00786563
,00626794
,00620565
,00607001
,03046205
,00630490
,00587763
,00603732
,00587718
,00431101
,00636103
,00422867
,00413578
,00392933
,03010865
,00630490
,00362507
,00387864
,00362433
,00365781
,00593779
,00356040
,00344956
,00319912
,03002209
,00587763
,00362507
,00313665
,000
,000
,031
,000
,000
,000
,127
,000
,000
,001
,000
,000
,907
,000
,000
,000
,127
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
-,1004917
,2062870
,0052673
,3630480
,2107978
,4752396
-,0118330
,0801798
,1395351
,0320451
,3885966
,1895671
-,0165047
,3465171
,1944782
,4593818
-,2488447
,0635237
,1243368
,0162991
,3733998
,1076785
-,1005677
,2647418
,1128339
,3780405
-,3378334
-,1174777
,0434742
-,0649652
,2925384
,0514885
-,1577416
,2086163
,0567852
,3221800
-,3964478
-,1746344
-,0744956
-,1207753
-,0731225
,4639744
,2660448
,6206355
,4682749
,7324797
,2488447
,3378334
,3964478
,2892289
,6455086
,2436826
,0508050
,4001547
,2475828
,5113257
,0118330
,1174777
,1746344
,0679632
,4236935
,1445698
-,0461335
,3009285
,1482257
,4116656
-,0801798
-,0635237
,0744956
-,0317739
,3235535
,0827900
-,1069292
,2390843
,0863047
,3495564
-,1395351
-,1243368
-,0434742
-,0939335
10
11
11
1
2
3
4
5
6
7
8
9
11
1
2
3
4
5
6
7
8
9
10
,24906111
,17449368
-,02498100
,33120475
,17889933
,44322263
-,16063703
-,04213115
,04836956
,10735442
,35641553
-,18192185
-,38139653
-,02521078
-,17751620
,08680710
-,51705256
-,39854668
-,30804597
-,24906111
-,35641553
Fuente: PASW 18.0.
Fuente: PASW 18.0.
206
,00281612
,00390925
,00609591
,00381826
,00371512
,00348383
,03005376
,00603732
,00387864
,00313665
,00313579
,00365707
,00593734
,00355964
,00344878
,00319828
,03002200
,00587718
,00362433
,00281612
,00313579
,000
,000
,079
,000
,000
,000
,001
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,2370117
,1577671
-,0510637
,3148674
,1630033
,4283163
-,2892289
-,0679632
,0317739
,0939335
,3429983
-,1975695
-,4068008
-,0404415
-,1922726
,0731225
-,6455086
-,4236935
-,3235535
-,2611105
-,3698327
,2611105
,1912203
,0011017
,3475421
,1947953
,4581290
-,0320451
-,0162991
,0649652
,1207753
,3698327
-,1662742
-,3559923
-,0099800
-,1627598
,1004917
-,3885966
-,3733998
-,2925384
-,2370117
-,3429983
Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del
tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable
dependiente. Se observa que los grupos 8 y 10 no son significativamente diferentes (“valor p” mínimo α=
0.242). Aquí se observa más claramente que los únicos grupos de ventas cuyas medias difieren entre sí son;
1, 2, 3, 4, 5, 6, 7, 8, 9 y 11.
viii.
ANOVA PARA DOCE GRUPOS
Fuente: PASW 18.0.
En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o
valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son
homogéneas. Si ello es así, se puede proceder con el análisis de varianza.
Fuente: PASW 18.0.
La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente
(grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La
sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de
las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo
un bajo riesgo de cometer una equivocación.
La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 12 niveles
del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o
desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para
contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de
207
confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 4, 6, 7, 8, 9, 10, 11 y 12 son
significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000, menor
que 0,05) y en cambio el grupo 5 no es significativamente diferente entre sí (“valor p”=1,000), mucho mayor
que 0,05).
Distancia del caso desde su centro inicial de clasificación
Scheffé
(I) Número inicial de
casos
1
2
3
(J) Número inicial de
casos
2
3
4
5
6
7
8
9
10
11
12
1
3
4
5
6
7
8
9
10
11
12
1
2
4
5
6
7
Diferencia
de medias
(I-J)
Error típico
Sig.
-,26737856
-,01964307
-,13927215
,00122266
-,63112670
-,67459586
-,26259151
-,51727147
-,32356216
-,04703926
-,34769440
,26737856
,24773550
,12810641
,26860122
-,36374814
-,40721730
,00478705
-,24989291
-,05618360
,22033930
-,08031583
,01964307
-,24773550
-,11962909
,02086573
-,61148363
-,65495279
,00378353
,00425551
,00381175
,00394134
,02959023
,00475150
,00413068
,00343346
,00320710
,00378385
,00315112
,00378353
,00467496
,00427496
,00439089
,02965345
,00513055
,00456162
,00394137
,00374583
,00425009
,00369802
,00425551
,00467496
,00469782
,00480356
,02971736
,00548788
,000
,030
,000
1,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
1,000
,000
,000
,000
,000
,030
,000
,000
,064
,000
,000
208
Intervalo de confianza al
95%
Límite
Límite
inferior
superior
-,2841613
-,2505958
-,0385194
-,0007668
-,1561800
-,1223643
-,0162600
,0187054
-,7623809
-,4998725
-,6956722
-,6535195
-,2809141
-,2442689
-,5325014
-,5020416
-,3377880
-,3093364
-,0638234
-,0302551
-,3616719
-,3337169
,2505958
,2841613
,2269987
,2684723
,1091439
,1470690
,2491244
,2880780
-,4952828
-,2322135
-,4299750
-,3844596
-,0154470
,0250211
-,2673758
-,2324100
-,0727991
-,0395681
,2014870
,2391916
-,0967192
-,0639124
,0007668
,0385194
-,2684723
-,2269987
-,1404673
-,0987908
-,0004416
,0421730
-,7433018
-,4796655
-,6792955
-,6306100
4
5
6
7
8
9
10
11
12
1
2
3
5
6
7
8
9
10
11
12
1
2
3
4
6
7
8
9
10
11
12
1
2
3
4
5
7
8
9
10
11
12
1
2
-,24294844
-,49762841
-,30391909
-,02739620
-,32805133
,13927215
-,12810641
,11962909
,14049481
-,49185455
-,53532371
-,12331936
-,37799932
-,18429001
,09223289
-,20842224
-,00122266
-,26860122
-,02086573
-,14049481
-,63234936
-,67581852
-,26381417
-,51849413
-,32478482
-,04826192
-,34891705
,63112670
,36374814
,61148363
,49185455
,63234936
-,04346916
,36853519
,11385523
,30756454
,58408744
,28343231
,67459586
,40721730
209
,00496010
,00439644
,00422203
,00467521
,00417967
,00381175
,00427496
,00469782
,00441523
,02965707
,00515140
,00458505
,00396847
,00377433
,00427523
,00372688
,00394134
,00439089
,00480356
,00441523
,02967400
,00524801
,00469333
,00409310
,00390516
,00439116
,00385932
,02959023
,02965345
,02971736
,02965707
,02967400
,02979243
,02969974
,02961082
,02958543
,02965349
,02957941
,00475150
,00513055
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
1,000
,000
,064
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,998
,000
,193
,000
,000
,000
,000
,000
-,2649501
-,5171298
-,3226469
-,0481342
-,3465912
,1223643
-,1470690
,0987908
,1209101
-,6234052
-,5581739
-,1436574
-,3956024
-,2010319
,0732691
-,2249537
-,0187054
-,2880780
-,0421730
-,1600796
-,7639751
-,6990973
-,2846325
-,5366500
-,3421070
-,0677399
-,3660359
,4998725
,2322135
,4796655
,3603039
,5007236
-,1756203
,2367952
-,0174903
,1763316
,4525526
,1522261
,6535195
,3844596
-,2209468
-,4781270
-,2851913
-,0066582
-,3095115
,1561800
-,1091439
,1404673
,1600796
-,3603039
-,5124735
-,1029813
-,3603963
-,1675481
,1111967
-,1918908
,0162600
-,2491244
,0004416
-,1209101
-,5007236
-,6525398
-,2429958
-,5003383
-,3074626
-,0287839
-,3317982
,7623809
,4952828
,7433018
,6234052
,7639751
,0886820
,5002752
,2452008
,4387975
,7156223
,4146385
,6956722
,4299750
8
9
10
3
4
5
6
8
9
10
11
12
1
2
3
4
5
6
7
9
10
11
12
1
2
3
4
5
6
7
8
10
11
12
1
2
3
4
5
6
7
8
9
,65495279
,53532371
,67581852
,04346916
,41200435
,15732439
,35103370
,62755660
,32690147
,26259151
-,00478705
,24294844
,12331936
,26381417
-,36853519
-,41200435
-,25467996
-,06097065
,21555225
-,08510288
,51727147
,24989291
,49762841
,37799932
,51849413
-,11385523
-,15732439
,25467996
,19370931
,47023221
,16957708
,32356216
,05618360
,30391909
,18429001
,32478482
-,30756454
-,35103370
,06097065
-,19370931
210
,00548788
,00515140
,00524801
,02979243
,00539166
,00487812
,00472154
,00513079
,00468369
,00413068
,00456162
,00496010
,00458505
,00469333
,02969974
,00539166
,00427573
,00409618
,00456188
,00405250
,00343346
,00394137
,00439644
,00396847
,00409310
,02961082
,00487812
,00427573
,00339187
,00394168
,00333899
,00320710
,00374583
,00422203
,00377433
,00390516
,02958543
,00472154
,00409618
,00339187
,000
,000
,000
,998
,000
,000
,000
,000
,000
,000
1,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,193
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,6306100
,5124735
,6525398
-,0886820
,3880884
,1356864
,3300902
,6047978
,3061259
,2442689
-,0250211
,2209468
,1029813
,2429958
-,5002752
-,4359203
-,2736459
-,0791402
,1953170
-,1030787
,5020416
,2324100
,4781270
,3603963
,5003383
-,2452008
-,1789624
,2357140
,1786639
,4527480
,1547662
,3093364
,0395681
,2851913
,1675481
,3074626
-,4387975
-,3719772
,0428011
-,2087547
,6792955
,5581739
,6990973
,1756203
,4359203
,1789624
,3719772
,6503154
,3476771
,2809141
,0154470
,2649501
,1436574
,2846325
-,2367952
-,3880884
-,2357140
-,0428011
,2357875
-,0671271
,5325014
,2673758
,5171298
,3956024
,5366500
,0174903
-,1356864
,2736459
,2087547
,4877164
,1843879
,3377880
,0727991
,3226469
,2010319
,3421070
-,1763316
-,3300902
,0791402
-,1786639
11
12
11
12
1
2
3
4
5
6
7
8
9
10
12
1
2
3
4
5
6
7
8
9
10
11
,27652290
-,02413223
,04703926
-,22033930
,02739620
-,09223289
,04826192
-,58408744
-,62755660
-,21555225
-,47023221
-,27652290
-,30065513
,34769440
,08031583
,32805133
,20842224
,34891705
-,28343231
-,32690147
,08510288
-,16957708
,02413223
,30065513
,00374615
,00310575
,00378385
,00425009
,00467521
,00427523
,00439116
,02965349
,00513079
,00456188
,00394168
,00374615
,00369834
,00315112
,00369802
,00417967
,00372688
,00385932
,02957941
,00468369
,00405250
,00333899
,00310575
,00369834
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,2599060
-,0379085
,0302551
-,2391916
,0066582
-,1111967
,0287839
-,7156223
-,6503154
-,2357875
-,4877164
-,2931398
-,3170600
,3337169
,0639124
,3095115
,1918908
,3317982
-,4146385
-,3476771
,0671271
-,1843879
,0103560
,2842503
,2931398
-,0103560
,0638234
-,2014870
,0481342
-,0732691
,0677399
-,4525526
-,6047978
-,1953170
-,4527480
-,2599060
-,2842503
,3616719
,0967192
,3465912
,2249537
,3660359
-,1522261
-,3061259
,1030787
-,1547662
,0379085
,3170600
Fuente: PASW 18.0.
Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del
tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable
dependiente. Se observa que los grupos 5, 1, 3 y 11 no son significativamente diferentes (“valor p” mínimo α=
0.212). Aquí se observa más claramente que los únicos grupos de ventas cuyas medias difieren entre sí son;
1, 3, 4, 5, 6, 7, 8, 9, 11 y 12.
211
Fuente: PASW 18.0.
ix.
ANOVA PARA TRECE GRUPOS
Fuente: PASW 18.0.
En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o
valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son
homogéneas. Si ello es así, se puede proceder con el análisis de varianza.
Fuente: PASW 18.0.
212
La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente
(grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La
sexta columna, denominada sig., presenta el “valor p” o mínimo de rechazo de la hipótesis de igualdad de
las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo
un bajo riesgo de cometer una equivocación.
La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 13 niveles
del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o
desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para
contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de
confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 5, 6, 7, 8 y 9, 10, 11 y 12
son significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”= 0.000,
menor que 0,05).
Distancia del caso desde su centro inicial de clasificación
Scheffé
(I) Número inicial de
casos
1
2
(J) Número inicial de
casos
2
3
4
5
6
7
8
9
10
11
12
13
1
3
4
5
6
7
8
9
Diferencia
de medias
(I-J)
Error típico
Sig.
,47189668
,06728601
,46015479
,14161380
-,16327846
,23115847
,45518906
-,20233021
,18090997
,21706703
,47583327
,26722678
-,47189668
-,40461067
-,01174189
-,33028288
-,63517514
-,24073821
-,01670762
-,67422690
,00419204
,00395147
,00404749
,00349564
,02947725
,00405571
,00438557
,00493270
,00383829
,00433274
,00351264
,00400613
,00419204
,00436313
,00445027
,00395503
,02953525
,00445775
,00475983
,00526824
,000
,000
,000
,000
,002
,000
,000
,000
,000
,000
,000
,000
,000
,000
,860
,000
,000
,000
,420
,000
213
Intervalo de confianza al
95%
Límite
Límite
inferior
superior
,4526741
,4911192
,0491666
,0854054
,4415951
,4787145
,1255846
,1576430
-,2984459
-,0281110
,2125611
,2497559
,4350791
,4752990
-,2249490
-,1797114
,1633095
,1985104
,1971993
,2369347
,4597261
,4919404
,2488567
,2855968
-,4911192
-,4526741
-,4246177
-,3846036
-,0321485
,0086648
-,3484186
-,3121471
-,7706086
-,4997417
-,2611792
-,2202973
-,0385338
,0051185
-,6983843
-,6500695
3
4
5
10
11
12
13
1
2
4
5
6
7
8
9
10
11
12
13
1
2
3
5
6
7
8
9
10
11
12
13
1
2
3
4
6
7
8
9
10
11
12
13
-,29098671
-,25482966
,00393659
-,20466990
-,06728601
,40461067
,39286878
,07432779
-,23056447
,16387246
,38790305
-,26961623
,11362396
,14978101
,40854726
,19994077
-,46015479
,01174189
-,39286878
-,31854099
-,62343325
-,22899632
-,00496573
-,66248501
-,27924482
-,24308777
,01567848
-,19292801
-,14161380
,33028288
-,07432779
,31854099
-,30489226
,08954467
,31357526
-,34394402
,03929617
,07545322
,33421947
,12561297
214
,00426090
,00471120
,00397006
,00441270
,00395147
,00436313
,00422443
,00369908
,02950206
,00423231
,00454938
,00507890
,00402445
,00449848
,00371514
,00418482
,00404749
,00445027
,00422443
,00380148
,02951508
,00432209
,00463303
,00515395
,00411876
,00458305
,00381711
,00427561
,00349564
,00395503
,00369908
,00380148
,02944448
,00381023
,00415960
,00473293
,00357793
,00410387
,00322610
,00375742
,000
,000
1,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,860
,000
,000
,000
,000
1,000
,000
,000
,000
,155
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
-,3105250
-,2764328
-,0142681
-,2249042
-,0854054
,3846036
,3734977
,0573657
-,3658457
,1444653
,3670419
-,2929054
,0951699
,1291533
,3915115
,1807513
-,4787145
-,0086648
-,4122398
-,3359726
-,7587742
-,2488152
-,0262104
-,6861184
-,2981313
-,2641033
-,0018248
-,2125337
-,1576430
,3121471
-,0912899
,3011094
-,4399095
,0720729
,2945015
-,3656468
,0228896
,0566350
,3194262
,1083834
-,2714484
-,2332265
,0221413
-,1844356
-,0491666
,4246177
,4122398
,0912899
-,0952832
,1832796
,4087642
-,2463270
,1320780
,1704087
,4255830
,2191302
-,4415951
,0321485
-,3734977
-,3011094
-,4880923
-,2091774
,0162789
-,6388516
-,2603583
-,2220723
,0331818
-,1733223
-,1255846
,3484186
-,0573657
,3359726
-,1698751
,1070164
,3326491
-,3222412
,0557027
,0942714
,3490127
,1428425
6
7
8
9
1
2
3
4
5
7
8
9
10
11
12
13
1
2
3
4
5
6
8
9
10
11
12
13
1
2
3
4
5
6
7
9
10
11
12
13
1
2
3
4
,16327846
,63517514
,23056447
,62343325
,30489226
,39443693
,61846752
-,03905175
,34418843
,38034548
,63911173
,43050524
-,23115847
,24073821
-,16387246
,22899632
-,08954467
-,39443693
,22403059
-,43348869
-,05024850
-,01409145
,24467480
,03606831
-,45518906
,01670762
-,38790305
,00496573
-,31357526
-,61846752
-,22403059
-,65751928
-,27427909
-,23812204
,02064421
-,18796229
,20233021
,67422690
,26961623
,66248501
215
,02947725
,02953525
,02950206
,02951508
,02944448
,02951621
,02956334
,02964944
,02948712
,02955555
,02944650
,02950943
,00405571
,00445775
,00423231
,00432209
,00381023
,02951621
,00464021
,00516041
,00412684
,00459031
,00382583
,00428339
,00438557
,00475983
,00454938
,00463303
,00415960
,02956334
,00464021
,00542350
,00445144
,00488420
,00417390
,00459694
,00493270
,00526824
,00507890
,00515395
,002
,000
,000
,000
,000
,000
,000
1,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,666
,000
,000
,000
,420
,000
1,000
,000
,000
,000
,000
,000
,000
,018
,000
,000
,000
,000
,000
,0281110
,4997417
,0952832
,4880923
,1698751
,2590908
,4829053
-,1750088
,2089757
,2448190
,5040853
,2951902
-,2497559
,2202973
-,1832796
,2091774
-,1070164
-,5297830
,2027530
-,4571517
-,0691721
-,0351403
,2271315
,0164269
-,4752990
-,0051185
-,4087642
-,0162789
-,3326491
-,7540297
-,2453082
-,6823886
-,2946911
-,2605185
,0015049
-,2090415
,1797114
,6500695
,2463270
,6388516
,2984459
,7706086
,3658457
,7587742
,4399095
,5297830
,7540297
,0969053
,4794012
,5158720
,7741382
,5658203
-,2125611
,2611792
-,1444653
,2488152
-,0720729
-,2590908
,2453082
-,4098257
-,0313249
,0069574
,2622181
,0557097
-,4350791
,0385338
-,3670419
,0262104
-,2945015
-,4829053
-,2027530
-,6326499
-,2538671
-,2157256
,0397835
-,1668831
,2249490
,6983843
,2929054
,6861184
10
11
12
5
6
7
8
10
11
12
13
1
2
3
4
5
6
7
8
9
11
12
13
1
2
3
4
5
6
7
8
9
10
12
13
1
2
3
4
5
6
7
8
,34394402
,03905175
,43348869
,65751928
,38324019
,41939724
,67816348
,46955699
-,18090997
,29098671
-,11362396
,27924482
-,03929617
-,34418843
,05024850
,27427909
-,38324019
,03615705
,29492330
,08631680
-,21706703
,25482966
-,14978101
,24308777
-,07545322
-,38034548
,01409145
,23812204
-,41939724
-,03615705
,25876625
,05015975
-,47583327
-,00393659
-,40854726
-,01567848
-,33421947
-,63911173
-,24467480
-,02064421
216
,00473293
,02964944
,00516041
,00542350
,00499135
,00538087
,00474549
,00512154
,00383829
,00426090
,00402445
,00411876
,00357793
,02948712
,00412684
,00445144
,00499135
,00439940
,00359454
,00407813
,00433274
,00471120
,00449848
,00458305
,00410387
,02955555
,00459031
,00488420
,00538087
,00439940
,00411835
,00454657
,00351264
,00397006
,00371514
,00381711
,00322610
,02944650
,00382583
,00417390
,000
1,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,666
,000
,000
,000
,000
,000
,000
1,000
,000
,155
,000
,000
,000
,018
,3222412
-,0969053
,4098257
,6326499
,3603524
,3947234
,6564031
,4460722
-,1985104
,2714484
-,1320780
,2603583
-,0557027
-,4794012
,0313249
,2538671
-,4061280
,0159837
,2784406
,0676166
-,2369347
,2332265
-,1704087
,2220723
-,0942714
-,5158720
-,0069574
,2157256
-,4440711
-,0563304
,2398816
,0293115
-,4919404
-,0221413
-,4255830
-,0331818
-,3490127
-,7741382
-,2622181
-,0397835
,3656468
,1750088
,4571517
,6823886
,4061280
,4440711
,6999239
,4930417
-,1633095
,3105250
-,0951699
,2981313
-,0228896
-,2089757
,0691721
,2946911
-,3603524
,0563304
,3114060
,1050170
-,1971993
,2764328
-,1291533
,2641033
-,0566350
-,2448190
,0351403
,2605185
-,3947234
-,0159837
,2776509
,0710080
-,4597261
,0142681
-,3915115
,0018248
-,3194262
-,5040853
-,2271315
-,0015049
13
9
10
11
13
1
2
3
4
5
6
7
8
9
10
11
12
-,67816348
-,29492330
-,25876625
-,20860649
-,26722678
,20466990
-,19994077
,19292801
-,12561297
-,43050524
-,03606831
,18796229
-,46955699
-,08631680
-,05015975
,20860649
Fuente: PASW 18.0.
Fuente: PASW 18.0.
217
,00474549
,00359454
,00411835
,00377323
,00400613
,00441270
,00418482
,00427561
,00375742
,02950943
,00428339
,00459694
,00512154
,00407813
,00454657
,00377323
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
-,6999239
-,3114060
-,2776509
-,2259086
-,2855968
,1844356
-,2191302
,1733223
-,1428425
-,5658203
-,0557097
,1668831
-,4930417
-,1050170
-,0710080
,1913044
-,6564031
-,2784406
-,2398816
-,1913044
-,2488567
,2249042
-,1807513
,2125337
-,1083834
-,2951902
-,0164269
,2090415
-,4460722
-,0676166
-,0293115
,2259086
Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del
tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable
dependiente. En este caso, se observa que los grupos 7, 11 y 10 no son significativamente diferentes (“valor
p” mínimo= 0.156) y los grupos 12, 2, 4, 8, 3 y 1 tampoco son significativamente diferentes entre sí (valor p
mínimo = 1). Aquí se observa claramente que los únicos grupos cuyas medias difieren entre sí son: 12, 2, 4,
8, 13, 5, 3, 1, 6 y 9.
x.
ANOVA PARA CATORCE GRUPOS
Fuente: PASW 18.0.
En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o
valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son
homogéneas. Si ello es así, se puede proceder con el análisis de varianza.
Fuente: PASW 18.0.
La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente
(grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La
sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de
las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo
un bajo riesgo de cometer una equivocación.
La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 14 niveles
del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o
218
desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para
contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de
confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,
13 y 14 son significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor p”=
0.000, menor que 0,05).
Distancia del caso desde su centro inicial de clasificación
Scheffé
(I) Número inicial de
casos
1
2
3
(J) Número inicial de
casos
2
3
4
5
6
7
8
9
10
11
12
13
14
1
3
4
5
6
7
8
9
10
11
12
13
14
1
Diferencia
de medias
(I-J)
Error típico
Sig.
-,04186290
-,72431360
-,36710700
-,24397295
-,29414723
-,42320644
-,35646254
-,08172785
-,32966204
-,68561714
-,04821372
-,48632238
-,06696186
,04186290
-,68245070
-,32524409
-,20211005
-,25228433
-,38134354
-,31459964
-,03986494
-,28779914
-,64375423
-,00635082
-,44445948
-,02509895
,72431360
,00413088
,00466970
,00403192
,00389129
,00416050
,00381082
,00327695
,00422299
,00338326
,02867232
,00392441
,00366267
,00379233
,00413088
,00528424
,00473006
,00461077
,00484014
,00454307
,00410555
,00489395
,00419089
,02877879
,00463876
,00441953
,00452757
,00466970
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
1,000
,000
,004
,000
219
Intervalo de confianza al
95%
Límite
Límite
inferior
superior
-,0613975
-,0223283
-,7463962
-,7022310
-,3861736
-,3480404
-,2623745
-,2255714
-,3138219
-,2744725
-,4412275
-,4051854
-,3719590
-,3409661
-,1016980
-,0617577
-,3456612
-,3136629
-,8212062
-,5500280
-,0667719
-,0296555
-,5036428
-,4690019
-,0848955
-,0490282
,0223283
,0613975
-,7074395
-,6574619
-,3476122
-,3028760
-,2239140
-,1803061
-,2751730
-,2293957
-,4028274
-,3598597
-,3340145
-,2951848
-,0630081
-,0167218
-,3076175
-,2679807
-,7798468
-,5076616
-,0282872
,0155855
-,4653591
-,4235599
-,0465095
-,0036884
,7022310
,7463962
4
5
6
2
4
5
6
7
8
9
10
11
12
13
14
1
2
3
5
6
7
8
9
10
11
12
13
14
1
2
3
4
6
7
8
9
10
11
12
13
14
1
2
,68245070
,35720661
,48034065
,43016637
,30110716
,36785106
,64258576
,39465156
,03869647
,67609988
,23799122
,65735175
,36710700
,32524409
-,35720661
,12313404
,07295976
-,05609945
,01064445
,28537915
,03744496
-,31851014
,31889327
-,11921539
,30014514
,24397295
,20211005
-,48034065
-,12313404
-,05017428
-,17923349
-,11248959
,16224510
-,08568909
-,44164419
,19575923
-,24234943
,17701110
,29414723
,25228433
220
,00528424
,00520724
,00509913
,00530743
,00503799
,00464731
,00535655
,00472287
,02886106
,00512445
,00492688
,00502402
,00403192
,00473006
,00520724
,00452232
,00475595
,00445327
,00400596
,00481071
,00409338
,02876475
,00455086
,00432717
,00443746
,00389129
,00461077
,00509913
,00452232
,00463733
,00432636
,00386439
,00469347
,00395494
,02874538
,00442674
,00419645
,00431009
,00416050
,00484014
,000
,000
,000
,000
,000
,000
,000
,000
1,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,899
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,6574619
,3325820
,4562273
,4050679
,2772829
,3458743
,6172550
,3723175
-,0977852
,6518667
,2146924
,6335935
,3480404
,3028760
-,3818312
,1017483
,0504692
-,0771586
-,0082994
,2626297
,0180877
-,4545364
,2973726
-,1396782
,2791607
,2255714
,1803061
-,5044540
-,1445198
-,0721039
-,1996925
-,1307640
,1400500
-,1043917
-,5775788
,1748255
-,2621941
,1566290
,2744725
,2293957
,7074395
,3818312
,5044540
,4552648
,3249314
,3898278
,6679165
,4169856
,1751781
,7003330
,2612901
,6811100
,3861736
,3476122
-,3325820
,1445198
,0954503
-,0350403
,0295883
,3081286
,0568022
-,1824839
,3404139
-,0987525
,3211296
,2623745
,2239140
-,4562273
-,1017483
-,0282447
-,1587745
-,0942152
,1844402
-,0669865
-,3057096
,2166929
-,2225048
,1973932
,3138219
,2751730
7
8
9
3
4
5
7
8
9
10
11
12
13
14
1
2
3
4
5
6
8
9
10
11
12
13
14
1
2
3
4
5
6
7
9
10
11
12
13
14
1
2
3
-,43016637
-,07295976
,05017428
-,12905921
-,06231531
,21241938
-,03551481
-,39146990
,24593351
-,19217515
,22718538
,42320644
,38134354
-,30110716
,05609945
,17923349
,12905921
,06674390
,34147859
,09354440
-,26241070
,37499272
-,06311594
,35624459
,35646254
,31459964
-,36785106
-,01064445
,11248959
,06231531
-,06674390
,27473469
,02680050
-,32915460
,30824882
-,12985984
,28950068
,08172785
,03986494
-,64258576
221
,00530743
,00475595
,00463733
,00457002
,00413536
,00491898
,00422010
,02878306
,00466516
,00444723
,00455462
,00381082
,00454307
,00503799
,00445327
,00432636
,00457002
,00378335
,00462698
,00387579
,02873460
,00435618
,00412195
,00423758
,00327695
,00410555
,00464731
,00400596
,00386439
,00413536
,00378335
,00419822
,00335229
,02866868
,00389774
,00363408
,00376473
,00422299
,00489395
,00535655
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,899
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
-,4552648
-,0954503
,0282447
-,1506705
-,0818711
,1891579
-,0554713
-,5275827
,2238723
-,2132058
,2056470
,4051854
,3598597
-,3249314
,0350403
,1587745
,1074479
,0488527
,3195980
,0752161
-,3982943
,3543927
-,0826083
,3362054
,3409661
,2951848
-,3898278
-,0295883
,0942152
,0427595
-,0846351
,2548817
,0109478
-,4647265
,2898167
-,1470451
,2716976
,0617577
,0167218
-,6679165
-,4050679
-,0504692
,0721039
-,1074479
-,0427595
,2356809
-,0155583
-,2553571
,2679947
-,1711445
,2487238
,4412275
,4028274
-,2772829
,0771586
,1996925
,1506705
,0846351
,3633592
,1118727
-,1265271
,3955927
-,0436236
,3762838
,3719590
,3340145
-,3458743
,0082994
,1307640
,0818711
-,0488527
,2945877
,0426532
-,1935827
,3266809
-,1126746
,3073038
,1016980
,0630081
-,6172550
10
11
12
4
5
6
7
8
10
11
12
13
14
1
2
3
4
5
6
7
8
9
11
12
13
14
1
2
3
4
5
6
7
8
9
10
12
13
14
1
2
3
4
-,28537915
-,16224510
-,21241938
-,34147859
-,27473469
-,24793419
-,60388929
,03351413
-,40459454
,01476599
,32966204
,28779914
-,39465156
-,03744496
,08568909
,03551481
-,09354440
-,02680050
,24793419
-,35595510
,28144832
-,15666034
,26270018
,68561714
,64375423
-,03869647
,31851014
,44164419
,39146990
,26241070
,32915460
,60388929
,35595510
,63740341
,19929475
,61865528
,04821372
,00635082
-,67609988
-,31889327
222
,00481071
,00469347
,00491898
,00462698
,00419822
,00428171
,02879216
,00472097
,00450574
,00461176
,00338326
,00419089
,00472287
,00409338
,00395494
,00422010
,00387579
,00335229
,00428171
,02868102
,00398753
,00373022
,00385761
,02867232
,02877879
,02886106
,02876475
,02874538
,02878306
,02873460
,02866868
,02879216
,02868102
,02874988
,02871532
,02873215
,00392441
,00463876
,00512445
,00455086
,000
,000
,000
,000
,000
,000
,000
,000
,000
,673
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
1,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
1,000
,000
,000
-,3081286
-,1844402
-,2356809
-,3633592
-,2945877
-,2681821
-,7400451
,0111890
-,4259018
-,0070427
,3136629
,2679807
-,4169856
-,0568022
,0669865
,0155583
-,1118727
-,0426532
,2276863
-,4915854
,2625916
-,1743003
,2444578
,5500280
,5076616
-,1751781
,1824839
,3057096
,2553571
,1265271
,1935827
,4677335
,2203248
,5014475
,0635023
,4827832
,0296555
-,0155855
-,7003330
-,3404139
-,2626297
-,1400500
-,1891579
-,3195980
-,2548817
-,2276863
-,4677335
,0558392
-,3832872
,0365747
,3456612
,3076175
-,3723175
-,0180877
,1043917
,0554713
-,0752161
-,0109478
,2681821
-,2203248
,3003050
-,1390204
,2809425
,8212062
,7798468
,0977852
,4545364
,5775788
,5275827
,3982943
,4647265
,7400451
,4915854
,7733593
,3350872
,7545273
,0667719
,0282872
-,6518667
-,2973726
13
14
5
6
7
8
9
10
11
13
14
1
2
3
4
5
6
7
8
9
10
11
12
14
1
2
3
4
5
6
7
8
9
10
11
12
13
-,19575923
-,24593351
-,37499272
-,30824882
-,03351413
-,28144832
-,63740341
-,43810866
-,01874813
,48632238
,44445948
-,23799122
,11921539
,24234943
,19217515
,06311594
,12985984
,40459454
,15666034
-,19929475
,43810866
,41936053
,06696186
,02509895
-,65735175
-,30014514
-,17701110
-,22718538
-,35624459
-,28950068
-,01476599
-,26270018
-,61865528
,01874813
-,41936053
Fuente: PASW 18.0.
223
,00442674
,00466516
,00435618
,00389774
,00472097
,00398753
,02874988
,00422718
,00434001
,00366267
,00441953
,00492688
,00432717
,00419645
,00444723
,00412195
,00363408
,00450574
,00373022
,02871532
,00422718
,00410486
,00379233
,00452757
,00502402
,00443746
,00431009
,00455462
,00423758
,00376473
,00461176
,00385761
,02873215
,00434001
,00410486
,000
,000
,000
,000
,000
,000
,000
,000
,134
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,004
,000
,000
,000
,000
,000
,000
,673
,000
,000
,134
,000
-,2166929
-,2679947
-,3955927
-,3266809
-,0558392
-,3003050
-,7733593
-,4580987
-,0392717
,4690019
,4235599
-,2612901
,0987525
,2225048
,1711445
,0436236
,1126746
,3832872
,1390204
-,3350872
,4181187
,3999490
,0490282
,0036884
-,6811100
-,3211296
-,1973932
-,2487238
-,3762838
-,3073038
-,0365747
-,2809425
-,7545273
-,0017754
-,4387721
-,1748255
-,2238723
-,3543927
-,2898167
-,0111890
-,2625916
-,5014475
-,4181187
,0017754
,5036428
,4653591
-,2146924
,1396782
,2621941
,2132058
,0826083
,1470451
,4259018
,1743003
-,0635023
,4580987
,4387721
,0848955
,0465095
-,6335935
-,2791607
-,1566290
-,2056470
-,3362054
-,2716976
,0070427
-,2444578
-,4827832
,0392717
-,3999490
Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del
tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable
dependiente. En este caso, se observa que los grupos 5 y 6 no son significativamente diferentes (“valor p”
mínimo= 0.132). Aquí se observa claramente que los grupos cuyas medias no difieren entre sí son: 1, 14, 9, 5,
8, 4, 7, 13, 11, 3.
Fuente: PASW 18.0.
xi.
ANOVA PARA QUINCE GRUPOS
Fuente: PASW 18.0.
En esta prueba se contrasta la hipótesis nula de homogeneidad de varianzas. Dado el nivel de mínimo α o
valor p (que puede verse en la columna sig.) es mayor al 5% es razonable suponer que las varianzas son
homogéneas. Si ello es así, se puede proceder con el análisis de varianza.
224
Fuente: PASW 18.0.
La tabla ANOVA presenta los resultados de la prueba. En este caso, el efecto de la variable independiente
(grupos) es llamado efecto inter-grupos, y el efecto debido al error aleatorio es llamado efecto Intra-grupos. La
sexta columna, denominada sig., presenta el “valor p” o mínimo α de rechazo de la hipótesis de igualdad de
las medias. Ello lleva a concluir que es posible detectar diferencias en los promedios de los grupos, corriendo
un bajo riesgo de cometer una equivocación.
La prueba de comparaciones múltiples de Scheffé presenta para cada posible combinación de los 15 niveles
del tratamiento (grupos) la siguiente información: La diferencia de las medias muestrales, el error típico o
desviación estándar muestral del estimador de la diferencia de medias muestrales, el mínimo α para
contrastar la hipótesis de igualdad de las medias de los dos niveles del tratamiento, y un intervalo de
confianza al 95% de la diferencia de medias. Se puede ver que los grupos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,
13 y 14 y 15 son significativamente diferentes en unidades promedio de distancia al centro del clúster (“valor
p”= 0.000, menor que 0,05).
Distancia del caso desde su centro inicial de clasificación
Scheffé
(I) Número inicial de
casos
1
(J) Número inicial de
casos
2
3
4
5
6
7
8
9
10
11
Diferencia
de medias
(I-J)
Error típico
Sig.
-,04124279
-,10152903
-,16429138
-,35108151
-,30263205
-,61323887
-,41340040
-,54845597
,03229576
-,08000721
,00451724
,00455381
,00415103
,00439685
,00418253
,00616082
,00436855
,00668992
,00396016
,00463649
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
225
Intervalo de confianza al
95%
Límite
Límite
inferior
superior
-,0632272
-,0192584
-,1236914
-,0793666
-,1844935
-,1440892
-,3724800
-,3296830
-,3229875
-,2822766
-,6432222
-,5832555
-,4346611
-,3921397
-,5810143
-,5158976
,0130226
,0515690
-,1025720
-,0574424
2
3
4
12
13
14
15
1
3
4
5
6
7
8
9
10
11
12
13
14
15
1
2
4
5
6
7
8
9
10
11
12
13
14
15
1
2
3
5
6
7
8
9
-,21548831
-,28824763
-,36122962
-,51371426
,04124279
-,06028624
-,12304859
-,30983872
-,26138926
-,57199608
-,37215761
-,50721318
,07353856
-,03876442
-,17424551
-,24700483
-,31998683
-,47247147
,10152903
,06028624
-,06276235
-,24955248
-,20110303
-,51170984
-,31187137
-,44692694
,13382479
,02152182
-,11395928
-,18671860
-,25970059
-,41218524
,16429138
,12304859
,06276235
-,18679013
-,13834067
-,44894749
-,24910902
-,38416459
226
,00442233
,00462632
,00401946
,00444297
,00451724
,00477336
,00439077
,00462386
,00442056
,00632483
,00459695
,00684126
,00421077
,00485230
,00464809
,00484258
,00426659
,00466773
,00455381
,00477336
,00442838
,00465960
,00445792
,00635101
,00463289
,00686546
,00424998
,00488637
,00468364
,00487671
,00430530
,00470314
,00415103
,00439077
,00442838
,00426681
,00404561
,00606870
,00423764
,00660518
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,150
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
-,2370108
-,3107629
-,3807914
-,5353372
,0192584
-,0835171
-,1444175
-,3323420
-,2829031
-,6027776
-,3945299
-,5405081
,0530457
-,0623795
-,1968667
-,2705726
-,3407514
-,4951883
,0793666
,0370554
-,0843143
-,2722297
-,2227987
-,5426188
-,3344186
-,4803396
,1131411
-,0022590
-,1367535
-,2104525
-,2806535
-,4350743
,1440892
,1016797
,0412104
-,2075558
-,1580297
-,4784825
-,2697326
-,4163105
-,1939658
-,2657324
-,3416678
-,4920913
,0632272
-,0370554
-,1016797
-,2873354
-,2398754
-,5412145
-,3497853
-,4739183
,0940314
-,0151493
-,1516243
-,2234371
-,2992223
-,4497547
,1236914
,0835171
-,0412104
-,2268753
-,1794073
-,4808009
-,2893241
-,4135143
,1545085
,0453027
-,0911651
-,1629847
-,2387477
-,3892961
,1844935
,1444175
,0843143
-,1660245
-,1186516
-,4194125
-,2284854
-,3520186
5
6
7
10
11
12
13
14
15
1
2
3
4
6
7
8
9
10
11
12
13
14
15
1
2
3
4
5
7
8
9
10
11
12
13
14
15
1
2
3
4
5
6
,19658715
,08428417
-,05119692
-,12395625
-,19693824
-,34942288
,35108151
,30983872
,24955248
,18679013
,04844946
-,26215736
-,06231889
-,19737446
,38337727
,27107430
,13559320
,06283388
-,01014811
-,16263275
,30263205
,26138926
,20110303
,13834067
-,04844946
-,31060682
-,11076835
-,24582392
,33492782
,22262484
,08714375
,01438443
-,05859756
-,21108221
,61323887
,57199608
,51170984
,44894749
,26215736
,31060682
227
,00381526
,00451336
,00429306
,00450291
,00387678
,00431432
,00439685
,00462386
,00465960
,00426681
,00429746
,00623942
,00447871
,00676238
,00408136
,00474044
,00453118
,00473048
,00413893
,00455133
,00418253
,00442056
,00445792
,00404561
,00429746
,00609029
,00426850
,00662502
,00384951
,00454235
,00432352
,00453196
,00391049
,00434463
,00616082
,00632483
,00635101
,00606870
,00623942
,00609029
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,966
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,757
,000
,000
,000
,000
,000
,000
,000
,000
,1780191
,0623186
-,0720903
-,1458709
-,2158057
-,3704197
,3296830
,2873354
,2268753
,1660245
,0275347
-,2925232
-,0841158
-,2302854
,3635142
,2480037
,1135410
,0398117
-,0302913
-,1847831
,2822766
,2398754
,1794073
,1186516
-,0693643
-,3402469
-,1315422
-,2780664
,3161931
,2005182
,0661021
-,0076716
-,0776290
-,2322266
,5832555
,5412145
,4808009
,4194125
,2317915
,2809667
,2151552
,1062497
-,0303036
-,1020416
-,1780708
-,3284261
,3724800
,3323420
,2722297
,2075558
,0693643
-,2317915
-,0405220
-,1644635
,4032403
,2941449
,1576454
,0858561
,0099951
-,1404824
,3229875
,2829031
,2227987
,1580297
-,0275347
-,2809667
-,0899945
-,2135814
,3536625
,2447315
,1081854
,0364405
-,0395661
-,1899379
,6432222
,6027776
,5426188
,4784825
,2925232
,3402469
8
9
10
8
9
10
11
12
13
14
15
1
2
3
4
5
6
7
9
10
11
12
13
14
15
1
2
3
4
5
6
7
8
10
11
12
13
14
15
1
2
3
4
,19983847
,06478290
,64553464
,53323166
,39775057
,32499125
,25200926
,09952461
,41340040
,37215761
,31187137
,24910902
,06231889
,11076835
-,19983847
-,13505557
,44569617
,33339319
,19791210
,12515278
,05217078
-,10031386
,54845597
,50721318
,44692694
,38416459
,19737446
,24582392
-,06478290
,13505557
,58075174
,46844876
,33296767
,26020835
,18722635
,03474171
-,03229576
-,07353856
-,13382479
-,19658715
228
,00621951
,00802204
,00593977
,00641055
,00625740
,00640319
,00597948
,00627200
,00436855
,00459695
,00463289
,00423764
,00447871
,00426850
,00621951
,00674400
,00405084
,00471419
,00450372
,00470418
,00410884
,00452399
,00668992
,00684126
,00686546
,00660518
,00676238
,00662502
,00802204
,00674400
,00648693
,00692058
,00677896
,00691377
,00652330
,00679245
,00396016
,00421077
,00424998
,00381526
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,025
,000
,000
,000
,000
,1695695
,0257414
,6166271
,5020330
,3672972
,2938283
,2229085
,0690002
,3921397
,3497853
,2893241
,2284854
,0405220
,0899945
-,2301074
-,1678771
,4259816
,3104503
,1759935
,1022586
,0321740
-,1223311
,5158976
,4739183
,4135143
,3520186
,1644635
,2135814
-,1038244
,1022340
,5491813
,4347678
,2999760
,2265606
,1554789
,0016844
-,0515690
-,0940314
-,1545085
-,2151552
,2301074
,1038244
,6744422
,5644304
,4282039
,3561541
,2811100
,1300490
,4346611
,3945299
,3344186
,2697326
,0841158
,1315422
-,1695695
-,1022340
,4654107
,3563361
,2198307
,1480470
,0721676
-,0782966
,5810143
,5405081
,4803396
,4163105
,2302854
,2780664
-,0257414
,1678771
,6123222
,5021297
,3659594
,2938561
,2189738
,0677990
-,0130226
-,0530457
-,1131411
-,1780191
11
12
13
5
6
7
8
9
11
12
13
14
15
1
2
3
4
5
6
7
8
9
10
12
13
14
15
1
2
3
4
5
6
7
8
9
10
11
13
14
15
1
2
-,38337727
-,33492782
-,64553464
-,44569617
-,58075174
-,11230297
-,24778407
-,32054339
-,39352538
-,54601003
,08000721
,03876442
-,02152182
-,08428417
-,27107430
-,22262484
-,53323166
-,33339319
-,46844876
,11230297
-,13548110
-,20824042
-,28122241
-,43370706
,21548831
,17424551
,11395928
,05119692
-,13559320
-,08714375
-,39775057
-,19791210
-,33296767
,24778407
,13548110
-,07275932
-,14574131
-,29822596
,28824763
,24700483
229
,00408136
,00384951
,00593977
,00405084
,00648693
,00433846
,00410879
,00432758
,00367168
,00413100
,00463649
,00485230
,00488637
,00451336
,00474044
,00454235
,00641055
,00471419
,00692058
,00433846
,00476407
,00495401
,00439266
,00478324
,00442233
,00464809
,00468364
,00429306
,00453118
,00432352
,00625740
,00450372
,00677896
,00410879
,00476407
,00475416
,00416597
,00457594
,00462632
,00484258
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,150
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
-,4032403
-,3536625
-,6744422
-,4654107
-,6123222
-,1334173
-,2677806
-,3416048
-,4113946
-,5661147
,0574424
,0151493
-,0453027
-,1062497
-,2941449
-,2447315
-,5644304
-,3563361
-,5021297
,0911887
-,1586668
-,2323505
-,3026005
-,4569860
,1939658
,1516243
,0911651
,0303036
-,1576454
-,1081854
-,4282039
-,2198307
-,3659594
,2277875
,1122954
-,0958968
-,1660162
-,3204960
,2657324
,2234371
-,3635142
-,3161931
-,6166271
-,4259816
-,5491813
-,0911887
-,2277875
-,2994820
-,3756561
-,5259054
,1025720
,0623795
,0022590
-,0623186
-,2480037
-,2005182
-,5020330
-,3104503
-,4347678
,1334173
-,1122954
-,1841304
-,2598443
-,4104281
,2370108
,1968667
,1367535
,0720903
-,1135410
-,0661021
-,3672972
-,1759935
-,2999760
,2677806
,1586668
-,0496219
-,1254664
-,2759559
,3107629
,2705726
14
15
3
4
5
6
7
8
9
10
11
12
14
15
1
2
3
4
5
6
7
8
9
10
11
12
13
15
1
2
3
4
5
6
7
8
9
10
11
12
13
14
,18671860
,12395625
-,06283388
-,01438443
-,32499125
-,12515278
-,26020835
,32054339
,20824042
,07275932
-,07298199
-,22546664
,36122962
,31998683
,25970059
,19693824
,01014811
,05859756
-,25200926
-,05217078
-,18722635
,39352538
,28122241
,14574131
,07298199
-,15248465
,51371426
,47247147
,41218524
,34942288
,16263275
,21108221
-,09952461
,10031386
-,03474171
,54601003
,43370706
,29822596
,22546664
,15248465
Fuente: PASW 18.0.
230
,00487671
,00450291
,00473048
,00453196
,00640319
,00470418
,00691377
,00432758
,00495401
,00475416
,00438192
,00477337
,00401946
,00426659
,00430530
,00387678
,00413893
,00391049
,00597948
,00410884
,00652330
,00367168
,00439266
,00416597
,00438192
,00418788
,00444297
,00466773
,00470314
,00431432
,00455133
,00434463
,00627200
,00452399
,00679245
,00413100
,00478324
,00457594
,00477337
,00418788
,000
,000
,000
,757
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,966
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,025
,000
,000
,000
,000
,000
,1629847
,1020416
-,0858561
-,0364405
-,3561541
-,1480470
-,2938561
,2994820
,1841304
,0496219
-,0943078
-,2486976
,3416678
,2992223
,2387477
,1780708
-,0099951
,0395661
-,2811100
-,0721676
-,2189738
,3756561
,2598443
,1254664
,0516562
-,1728661
,4920913
,4497547
,3892961
,3284261
,1404824
,1899379
-,1300490
,0782966
-,0677990
,5259054
,4104281
,2759559
,2022357
,1321032
,2104525
,1458709
-,0398117
,0076716
-,2938283
-,1022586
-,2265606
,3416048
,2323505
,0958968
-,0516562
-,2022357
,3807914
,3407514
,2806535
,2158057
,0302913
,0776290
-,2229085
-,0321740
-,1554789
,4113946
,3026005
,1660162
,0943078
-,1321032
,5353372
,4951883
,4350743
,3704197
,1847831
,2322266
-,0690002
,1223311
-,0016844
,5661147
,4569860
,3204960
,2486976
,1728661
Para facilitar la interpretación, SPSS agrupa los resultados en subconjuntos homogéneos, es decir, niveles del
tratamiento que no son significativamente diferentes entre sí en cuanto a los valores promedio de la variable
dependiente. En este caso, se observa que los grupos 11 y 3 no son significativamente diferentes (“valor p”
mínimo= 0.201). Aquí se observa claramente que en todos los grupos las medias difieren entre sí.
Fuente: PASW 18.0.
Después de realizar el ANOVA para el número de grupos entre cinco y quince, se puede concluir que el
número óptimo de grupos debe ser alrededor de diez, ya que se espera que éstos sean suficientes para
describir adecuadamente los comportamientos más relevantes de los tarjetahabientes, además que después
de este número, los grupos empiezan a presentar semejanzas entre ellos35. Se concluye que el número
adecuado de grupos es ocho, ya que en esta cantidad de grupos, el ANOVA no muestra mayor
homogeneidad intergrupal. Igualmente se espera que no se presente un crecimiento desproporcionado al
combinarlo con las variables RAM y las variables demográficas, permitiendo que el análisis sea adecuado. No
menos que ocho pues se quedarían algunos grupos de interés por fuera del análisis.
35
Se buscan grupos heterogéneos entre ellos.
231
ANEXO I. Análisis de Conglomerados de K medias.
A continuación se presentan los centros de los conglomerados finales y las tablas de contingencia entre las
variables nominales: Calificación, MCC, conglomerados RAM, edad, género, estado civil y ocupación, y los
conglomerados finales. A cada una de ellas se le han destacado los valores que permiten la caracterización
de los clientes en cada uno de los conglomerados.
•
×
Conglomerados finales
Número de iteraciones ejecutadas y convergencia de los centros iniciales.
Fuente: PASW 18.0
Lo anterior implica que se halló la solución óptima y no trivial en la iteración 56.
×
Centro de conglomerados finales.
La siguiente tabla presenta la distancia final de los centros de cada una de las variables, en cada uno de los
ocho grupos encontrados. Los campos sombreados con rojo indican los mayores valores en cada uno de los
conglomerados, los campos sombreados con rojo y en negrita indican los valores más altos por fila y columna
conjuntamente.
Centros de los conglomerados finales
1
2
3
CONGLOMERADO
4
5
6
7
8
Puntua(NoTrxDeclinadas)
1,51824
,02533 -,09026
-,52388
,26565
-,90324
1,70496
-,53661
Puntua(porcVisaNal1)
-,84904
,05768
,06654
-1,08169
,11105
-,08696
,27701
-1,08169
Puntua(porcMasterNal1)
-1,25955
,13633
,08940
-1,48970
,21667
-,19429
,39321
-1,48970
Puntua(porcTrxNal1)
-3,56257
,21271
,20955
-4,49066
,19758
,26681
,15664
-4,49066
Puntua(porcMañana)
,21436
,00562 -,00326
-,31844
,15626
-,32220
,58927
-,36866
Puntua(porcTarde)
-,02271
,10966
-,78491
,16357
-,24433
,33549
-,82047
,07496
232
Puntua(porcLun)
,50492
-,05315 ,02051
-,15032
,10002
-,30058
,60683
-,14206
Puntua(porcMart)
,69018
-,07057 -,00694
-,14860
,10437
-,30158
,61959
-,06883
Puntua(porcMier)
,66161
-,03681 -,08984
-,11893
,08018
-,29362
,64757
-,17390
Puntua(porcJue)
,67490
-,01988 -,08541
-,10569
,06086
-,29091
,62874
-,13711
Puntua(porcVier)
,63364
-,01678 -,03709
-,16125
,06298
-,30391
,63810
-,19557
Puntua(porcSab)
,24566
-,00579 ,00006
-,23583
,16086
-,27864
,48821
-,35553
Puntua(porcFebr)
,26587
,04367 -,23618
-,19775
,01787
-,19215
,51883
-,22185
Puntua(porcMarz)
,28861
-,27289 -,28108
-,21334
,48173
-,19017
,44886
-,18943
Puntua(porcAbri)
,23818
-,44959 -,32055
-,20061
,82625
-,18549
,30658
-,15151
Puntua(porcMay)
,20129
-,45508 -,32388
-,12185
,85807
-,16731
,23383
-,15966
Puntua(porcJun)
,28289
,16425 -,37136
-,04539
,01722
-,17398
,34847
-,11561
Puntua(porcJul)
,21802
,19449 -,20651
-,10860
-,27253
-,16436
,54709
-,13058
Puntua(porcAgos)
,18890
,19388 -,18730
-,15928
-,28961
-,17605
,59517
-,15998
Puntua(porcSepti)
,16393
,15616 -,16137
-,17875
-,28116
-,17564
,63163
-,17750
Puntua(porcOctu)
,22882
,11895 -,07499
-,19785
-,28484
-,18333
,64460
-,13185
Puntua(porcNovi)
,30870
-,43969 2,5377
-,15332
-,38928
-,44206
,53614
-,11573
Puntua(porcDici)
,16261
,20993 -,09865
-,28096
-,25588
-,15556
,46000
-,27723
Puntua(promDeclinado1)
,53218
-,03686 -,02610
-,46077
-,08279
,03640
-,14097
1,57667
Puntua(desvEstandar)
,91747
,69991
,19433
-,49626
,71996
-1,27765
,79808
-,29595
Puntua(porcExtraCupo1)
,98082
,03581 -,06584 -1,20640
,14078
-,47160
,84818
,37047
Fuente: PASW 18.0
De lo anterior se puede concluir que las características más relevantes que presentan cada uno de los
conglomerados son:
•
Conglomerado 1: Muchas transacciones internacionales, alta variabilidad en los montos
declinados y porcentajes de extra cupos altos.
233
•
×
•
Conglomerado 2: No presenta parámetros relevantes.
•
Conglomerado 3: Transacciones frecuentes en noviembre y no mucho en junio.
•
Conglomerado 4: Transacciones internacionales con porcentaje de extra cupos bajos y de no
preferencia en la tarde.
•
Conglomerado 5: Transacciones frecuentes en marzo, abril, mayo con alta variabilidad en los
motos declinados.
•
Conglomerado 6: Pocas transacciones declinadas y no variabilidad en los montos declinados.
•
Conglomerado 7: Muchas transacciones declinadas, porcentajes de extra cupos altos y alta
variabilidad en los montos declinados.
•
Conglomerado 8: Transacciones internacionales con altos promedios de declinación.
Tablas de contingencia
CON LA CALIFICACIÓN
Fuente: PASW 18.0
Lo anterior implica que la prueba fue significativa al nivel 5%.
La tabla de contingencia entre la calificación y los ocho conglomerados iniciales se muestran a continuación.
Los valores sombreados con rojo indican los residuos tipificados más altos por variable, comparados contra el
valor 25,02. En los casos en los que los residuos tipificados no alcanzan a ser mayores a este valor, se
buscan los valores más altos por cada variable. Los valores sombreados con rojos y en negrita indican los
residuos tipificados más altos por variable y por conglomerado.
234
Tabla de contingencia por calificación
NÚMERO INICIAL DE CASOS
1
Recuento
2
2.342 37.044
3
4
5
15.379 2.625 31.022
6
7
8
55.546
24.653
3.907
TOTAL
172.518
A
Residuos tipificados
1,6
-3,2
-2,2
1,3
3,3
,4
-1,1
4,1
Recuento
124
2.713
1.192
128
2.134
3.938
1.837
126
Residuos tipificados
-2,9
1,0
2,6
-3,9
-,4
,3
2,0
-8,2
Recuento
33
930
447
50
622
1.296
605
31
Residuos tipificados
-2,7
1,8
4,3
-1,2
-3,2
,2
1,1
-5,9
Recuento
25
1.125
409
47
250
1.042
542
25
Residuos tipificados
-3,0
13,4
5,3
-,6
-14,6
-2,2
1,9
-5,7
Recuento
18
427
133
18
117
383
209
16
Residuos tipificados
,2
8,2
1,2
-,4
-7,6
-2,0
1,4
-2,3
62.205
27.846
4.105
12.192
B
4.014
CALIFICACIÓN C
3.465
D
1.321
E
Recuento
TOTAL
2.542 42.239
17.560 2.868 34.145
193.510
Fuente: PASW 18.0.
De lo anterior se puede concluir que las calificaciones más relevantes que presentan cada uno de los
conglomerados son:
•
Conglomerado 1: Calificación más frecuente: A.
•
Conglomerado 2: Calificación más frecuente: D y E.
•
Conglomerado 3: Calificación más frecuente: C y D.
•
Conglomerado 4: Calificación más frecuente: A.
•
Conglomerado 5: Calificación más frecuente: A.
235
×
•
Conglomerado 6: Calificación más frecuente: no presenta un parámetro relevante.
•
Conglomerado 7: Calificación más frecuente: B.
•
Conglomerado 8: Calificación más frecuente: A.
CON EL MCC
Fuente: PASW 18.0
Lo anterior implica que la prueba fue significativa al nivel 5%.
La tabla de contingencia entre los MCC y los ocho conglomerados se presenta a continuación. Los valores
sombreados con rojo indican los residuos tipificados más altos por variable, comparados contra el valor 25,02.
En los casos en los que los residuos tipificados no alcanzan a ser mayores a este valor, se buscan los valores
más altos por cada variable.
236
FRECUENTE
MCC
1,1
1
-2,1
0
-1,8
171
6,3
3
-1,2
0
-1,8
6
1,5
0
-,8
2
-,3
875
103,0
3
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
VETERINARIOS
ALMACENES DE EQUIPOS, INSUMOS y
SERVICIOS AGROPECUARIOS
VÍVEROS Y ALMACENES PARA
JARDINERÍA
CONTRATISTAS GENERALES -
RESIDENCIALES Y COMERCIALES
TRANSPORTE DE PASAJEROS,
TERRESTRE, FLUVIAL y MARITÍMO
SERVICIOS DE MENSAJERÍA, CORREO Y
ENCOMIENDAS
COMPAÑÍAS DE AVIACION
COMPRAS EN INTERNET
SERVICIOS DE AMBULANCIA
OUTLETS
AEROLÍNEAS
237
6
218
-12,6
629
1,4
51
-,8
9
2,9
76
5,8
98
4,8
147
-,5
1.736
1,7
67
2,3
129
2,3
82
99
-7,7
270
-1,1
13
-1,3
2
1,1
28
1,9
32
3,4
63
5,8
888
2,2
33
-1,0
37
1,8
36
1
67,4
635
-1,1
1
-,9
0
-,4
3
-1,9
0
,1
7
-2,1
96
-1,4
1
-2,7
0
-,2
4
48,7
201
-3,2
744
,5
37
-,8
7
,9
50
2,3
60
,1
81
3,9
1.569
,3
46
4,1
123
3,0
73
-29,3
272
-35,6
133
-1,9
47
-3,6
2
-2,0
62
-5,8
29
-4,2
95
-7,1
2.225
-1,8
64
-2,4
125
-4,8
47
40,7
95
9,8
938
2,4
40
9,2
33
-2,3
22
-,5
33
-2,3
47
-4,8
996
,1
36
-,2
68
-,3
40
-41,9
Recuento
-9,3
7.082
CLÍNICAS VETERINARIAS Y SERVICIOS
-20,1
968
-,7
895
Residuos tipificados
911
106
1.884
170
Recuento
SIN NOMBRE
7
Tabla de contingencia por MCC
NÚMERO INICIAL DE CASOS
1
2
3
4
5
6
11
41,3
515
-1,5
1
-1,1
0
-1,0
3
-2,3
0
,4
11
15,4
372
-1,9
1
-3,2
0
-,9
4
78,8
1.631
8
900
4.739
192
53
250
252
454
8.053
248
483
292
13.647
TOTAL
0
-,5
9
-,9
0
-,8
4
-3,2
0
-,7
1
-2,6
13
-5,5
4
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
SUSCRIPCIÓN T.V POR CABLE Y OTROS
SERVICIOS DE RADIO Y TV PAGOS
COMPUTADORES - EQUIPOS -
ACCESORIOS - SOTFWARE
SUSCRIPCIÓN Y VENTA DE PERIÓDICOS
Y REVISTAS
DÉPOSITO DE MATERIALES DE
CONSTRUCCIÓN
ALMACENES POR DEPARTAMENTO SIN
SUPERMERCADO
ALMACENES DE MISCELÁNEAS,
SUPERMERCADOS / TIENDAS EXPRESS
REGALO / TODO TIPO DE ALMACENES
CACHARRERÍA Y ARTÍCULOS PARA
FERRETERÍAS
ALMACENES DE VIDRIOS Y ESPEJOS
238
-10,9
-7,5
Residuos tipificados
TELECOMUNICACIONES
Residuos tipificados
8
Recuento
VENTA DE EQUIPOS Y SERVICIOS DE
246
23,2
Residuos tipificados
Recuento
18
Recuento
-5,3
-3,4
Residuos tipificados
TURISMO
Residuos tipificados
12
Recuento
AGENCIAS DE VIAJE Y OPERADORES DE
TRANSPORTE DE CARGA EN GENERAL
-2,6
Residuos tipificados
18,7
9.772
9,4
821
8,9
1.145
2,6
172
,3
8
3,0
335
,5
12
1,7
225
-1,1
2
3,9
1.331
-3,1
0
3,4
591
1,5
9,1
3.889
4,0
309
6,1
484
1,1
67
-1,2
1
2,6
147
-,6
3
,5
88
-1,3
0
2,2
545
-2,0
0
2,1
244
1,9
-14,7
205
-5,6
5
-7,0
6
-2,8
1
-,7
0
-3,7
3
-,8
0
,9
17
-,5
0
-8,6
4
1,7
2
-5,7
1
-3,4
11,6
7.474
3,1
546
8,3
933
1,6
131
2,6
12
3,9
289
1,3
12
2,1
190
-,3
3
10,6
1.297
,1
8
-,5
405
3,3
-31,8
8.434
-6,7
674
-6,9
1.048
-,6
199
-,5
9
-,9
401
-,3
14
-,1
295
-1,4
3
-8,2
1.415
-3,7
0
1,3
792
-1,0
21,4
6.891
-1,9
352
-7,2
408
-1,8
76
-,8
3
-4,8
122
-,3
6
-3,9
88
5,4
12
3,1
874
-1,3
3
-2,3
296
-3,0
-23,2
136
-7,3
2
-9,1
1
-3,7
0
-,8
0
-4,7
3
-1,0
0
-1,9
11
-,7
0
-10,7
1
11,6
12
-4,9
15
-1,9
37.047
2.713
4.038
647
33
1.304
47
923
20
5.475
43
2.356
-1,3
0
-,6
3
-,4
4
-17,8
5
-3,6
1
-3,3
5
-4,3
27
-9,7
0
-,6
201
1,5
28
-13,6
0
-,2
1
-3,8
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
PANADERÍAS, REPOSTERÍAS, SALONES
DE TÉ Y CAFETERÍAS
ALMACÉN POR DEPARTAMENTO CON
SUPERMERCADO
VENTA DE VEHÍCULOS AUTOMOTORES Y
MOTOCICLETAS
REPUESTOS Y ACCESORIOS
AUTOMOTRICES
ESTACIONES DE SERVICIO (Venta de
gasolina y gas vehicular)
VENTA DE BOTES Y ACCESORIOS PARA
ACTIVIDADES ACUÁTICAS
ALMACENES DE VESTUARIO Y
ACCESORIOS PARA TODA LA FAMILIA
MUEBLES PARA EL HOGAR Y OFICINA
SASTRES, MODISTAS, CLÍNICAS DE ROPA
ALMACENES DE CALZADO
SERVITECAS Y LLANTAS
DULCERÍAS
239
2
Recuento
SALSAMENTARIAS Y VENTA DE CARNES
2,0
304
-,7
0
-23,5
2.474
10,0
3.560
2,1
11
-2,5
2.246
3,6
538
1,3
235
1,6
398
7,1
5.951
1,3
74
1,4
9
1,8
99
-,6
107
-,4
0
-3,2
1.513
2,0
1.323
-1,6
0
-,6
966
-1,0
178
,1
90
,8
163
-1,1
2.203
1,5
34
-,2
2
1,5
43
-4,3
0
-,2
0
-14,5
31
,7
214
-,6
0
-10,6
26
-5,4
1
-3,8
0
-3,6
7
-19,2
0
-1,1
2
1,0
1
-2,4
0
,6
228
-,6
0
-29,5
1.528
-,7
2.402
-1,3
2
10,8
2.388
3,2
435
3,3
217
2,0
332
19,3
5.665
1,5
62
1,1
7
1,9
82
4,8
495
,4
1
80,7
11.976
-10,8
3.715
,4
10
-23,2
2.120
-1,4
644
,2
321
3,3
619
-9,8
7.115
-1,5
79
-,5
7
-2,3
96
-5,4
107
1,3
1
-40,6
535
5,7
2.238
,1
4
38,1
3.069
,0
305
-1,8
121
-6,1
148
5,6
3.913
-,9
36
-1,9
0
,1
55
-4,7
2
-,2
0
-18,4
23
-8,8
142
-,8
0
-14,4
11
-5,5
8
-4,4
1
-3,5
15
-23,0
0
-2,1
1
-,7
0
-2,5
1
1.244
2
18.108
13.795
27
10.853
2.114
986
1.687
24.851
291
26
378
0
Recuento
ALMACENES DE COLGADURAS,
-,2
1
-1,9
0
-2,7
13
,8
0
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
ALMACENES DE ARTÍCULOS PARA EL
HOGAR
ALMACENES DE ELECTRODOMÉSTICOS
Y GASODOMÉSTICOS
ALMACENES DE VENTA DE EQUIPOS
ELECTRÓNICOS
ALMACENES DE MÚSICA -
13
7,0
0
-,9
0
-,3
36
1,8
4
,9
6
-2,6
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
ALMACENES DE COMPUTADORES Y
SOFTWARE
RESTAURANTES, PIZZERÍAS, FUENTES
DE SODA
VENTA DE COMIDA RÁPIDA
BARES, TABERNAS, DISCOTECAS
EVENTOS, FIESTAS Y BANQUETES
ALMACENES DE DISCOS
240
-,8
PARTITURAS
Residuos tipificados
INSTRUMENTOS MUSICALES, PIANOS,
VENTANAS
Residuos tipificados
TAPICERÍA Y CUBIERTAS PARA
1,4
Residuos tipificados
PISOS
3
Recuento
ALMACÉN DE TAPETES, ALFOMBRAS Y
-1,8
245
,0
42
-1,1
421
-1,0
0
-,1
12
-1,1
32
1,6
15
-,1
172
-,9
113
-1,5
77
1,7
2
,5
25
-,7
107
,2
18
1,8
209
,8
1
-,5
4
-1,0
12
-2,0
0
-,3
70
-2,3
35
1,7
48
1,4
1
1,2
13
-4,1
1
,7
4
-,9
25
-,3
0
-,9
0
7,0
14
-,8
0
-2,0
5
-2,5
1
-2,5
0
-,2
0
-1,2
0
3,8
278
1,1
40
-1,4
333
1,2
2
,0
10
-1,8
21
,3
9
-1,6
122
-,2
98
-,7
68
-,7
0
-1,2
13
1,7
439
-,3
59
-,8
636
-,5
1
1,4
24
-2,8
36
1,1
19
3,4
311
7,1
277
4,0
180
-1,0
0
2,1
45
,0
181
-1,6
19
4,6
373
,3
1
-,7
6
-2,5
13
-1,4
3
-2,4
89
-4,6
40
-2,2
43
-,7
0
-3,6
1
-5,2
0
,5
5
-5,7
6
-,3
0
-1,1
0
16,6
36
-1,0
0
-,7
14
-3,5
0
-3,0
0
-,3
0
,6
3
1257
191
2.039
5
56
177
46
796
564
417
3
103
0
-,6
3
Recuento
Residuos tipificados
Recuento
0
-,4
19
2,4
3
-3,2
0
-1,3
5
,2
0
-,7
0
-1,8
1
-2,6
1
-1,9
3
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
ALMACÉN DE BICICLETAS VENTA Y
SERVICIOS
ALMACENES DE ARTÍCULOS
DEPORTIVOS
PAPELERÍAS ( Almacenes de artículos para
oficina y colegios)
ALMACENES DE RELOJES, JOYAS Y
PLATERÍAS
ALMACENES DE JUEGOS, JUGUETES Y
HOBBIES
ALMACENES DE CÁMARAS Y EQUIPOS
FOTOGRÁFICOS
ALMACENES DE ARTÍCULOS DE CUERO Y
MALETAS
MERCADEO DIRECTO - SERVICIOS DE
ALMACENES DE TELAS
LIBRERÍAS
241
-,5
restauración) / PINTURAS / MUSEOS / ARTE
Residuos tipificados
ANTIGÜEDADES (Ventas, reparación y
ALMACENES DE ARTÍCULOS TÍPICOS,
CIGARRERÍAS Y LICORERAS
-3,5
Residuos tipificados
NATURISTAS
16
Recuento
DROGUERÍAS, FARMACIAS, TIENDAS
237
1,1
101
,3
150
1,8
68
-,4
7
1,6
92
-,2
29
2,1
295
2,2
214
,4
4
,5
70
1,3
10
5,0
751
154
,4
40
,0
61
1,1
28
,4
4
,1
33
,7
15
-2,1
86
-1,4
64
,5
2
,1
28
-1,0
1
-1,3
239
0
-2,5
0
-3,2
0
-1,9
0
-,7
0
-1,9
1
-1,4
0
-3,3
4
1,3
17
-,5
0
2,6
10
-,7
0
-4,7
12
335
1,4
85
,0
118
-2,0
31
,6
8
-1,1
54
-1,9
15
-1,7
186
-2,4
119
,8
4
-1,4
43
-1,4
2
-3,5
427
558
,5
138
3,1
261
3,7
114
,3
13
1,8
133
2,9
64
7,1
522
3,4
327
-,4
4
2,9
125
,4
11
2,7
1.003
633
-1,5
48
-2,3
74
-4,2
11
-,1
5
-2,7
32
-1,1
15
-5,9
95
-4,8
68
-,8
1
-3,8
18
,8
6
-,2
408
0
-3,0
0
-2,4
5
-2,3
0
-,9
0
-,9
5
-1,7
0
-4,6
2
-,9
14
-,6
0
-,9
4
-,8
0
-6,8
8
1.920
413
670
252
37
355
138
1.193
842
15
301
30
2.864
0
-2,3
0
-,2
0
-1,2
8
-,1
0
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
MERCADEO DIRECTO - COMERCIANTES
DE VENTAS TELEFÓNICAS / AMWAY
VENTA DE ARTÍCULOS MÉDICOS,
ODONTOLÓGICOS, ORTOPÉDICOS
PERFUMERÍAS Y TIENDAS DE
COSMÉSTICOS
DISTRIBUIDORES DE MATERIALES PARA
-,3
0
-,4
0
-,3
10
12,4
1
-2,6
0
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
ALMACENES DE MASCOTAS - ALIMENTOS
Y ACCESORIOS PARA MASCOTAS
INMOBILIARIAS
ASEGURADORAS
ENTIDADES FINANCIERAS
PRODUCTOS QUÍMICOS
242
0
FLORISTERÍAS
Recuento
MADERA
COMBUSTIBLE, PÉTROLEO LÍQUIDO,
COMBUSTIBLE, CARBÓN, ACEITE
-,2
-6,8
Residuos tipificados
DE VENTAS TELEFÓNICAS / DIRECTV
Residuos tipificados
11
Recuento
MERCADEO DIRECTO - COMERCIANTES
GALERÍAS DE ARTE - MARQUETERÍAS
-4,4
Residuos tipificados
SEGUROS
1
-3,2
103
-2,1
3
,9
3
-,4
2
-1,0
0
-,7
0
1,4
155
,1
25
-,8
0
-1,4
77
-9,7
775
-8,9
0
-2,3
41
-1,5
1
-,9
0
,9
2
2,3
2
-,4
0
-,6
53
-1,3
6
3,3
2
,1
38
-3,5
382
-1,5
0
-3,1
0
12,8
11
-,3
0
-,4
0
-,3
0
-,2
0
-,8
7
-1,3
0
-,2
0
-1,7
2
-8,6
0
-5,3
2
-2,3
89
,8
10
-,3
1
-,8
1
-,9
0
-,6
0
-,9
103
1,4
26
-,7
0
1,7
88
-3,6
781
-,2
4
9,9
349
-3,8
0
,3
3
1,1
6
,3
2
1,7
2
2,5
240
1,9
48
,0
1
1,1
146
1,3
1.667
-2,4
0
-3,4
60
-1,3
3
-,1
1
-,6
1
,3
1
-,5
0
-2,7
66
-2,0
8
-,7
0
,3
62
25,6
1.412
21,5
0
-3,7
0
5,2
6
-,4
0
-,5
0
-,3
0
-,2
0
-2,3
5
-1,5
0
-,3
0
-2,6
1
-10,2
1
-6,4
7
643
44
8
12
5
2
637
113
3
414
5.029
12,3
0
-1,1
0
-,2
2
-1,2
0
-,8
0
-,1
0
-1,2
0
-,3
0
-,8
0
-,3
0
-,2
0
-,6
0
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
SERVICIOS FUNERARIOS Y PARQUES
CEMENTERIOS
GIMNASIOS, SAUNA, BAÑOS TURCOS y
CENTROS DE ESTÉTICA
GRILES -WISKERIAS- NIGHT CLUB -STRIP
TEASE
SERVICIOS DE PUBLICIDAD, MEDIOS Y
ARTES GRÁFICAS
SERVICIOS DE REPRODUCCCIÓN Y
FOTOCOPIAS
ADMINISTRACIÓN DE ÁREAS COMUNES,
SERV. DE LIMPIEZA, MANT. Y CELADURÍA
SERVICIOS Y ASESORIAS
PROFESIONALES
AGENCIAS DE PROTECCIÓN Y
ALQULER DE VESTIDOS Y DISFRACES
SALONES DE BELLEZA - PELUQUERÍAS
LAVANDERÍAS - LAVASECOS
MOTELES y AMOBLADOS
243
103
Recuento
HOTELES - CENTROS VACACIONALES
-,3
Residuos tipificados
0
-2,0
1
1,7
2
-,3
1
,5
11
-1,1
0
-,6
22
-,5
0
-1,0
8
-1,1
67
-,7
0
,2
22
6,5
691
-,4
0
,4
3
-,5
0
-,7
0
-,5
3
-,7
0
,8
13
-,3
0
,5
6
-1,0
26
1,9
1
,7
11
-2,2
192
-,8
0
-,6
0
-,2
0
-,3
0
-,8
0
-,3
0
-1,3
0
-,1
0
-,9
0
-2,3
0
-,2
0
,5
2
,9
42
-,3
0
,2
5
-,7
0
,9
2
,5
9
,9
2
-,2
19
2,0
1
-,8
7
,4
65
1,1
1
,2
18
-,6
425
,7
3
2,6
16
,0
1
,1
2
-1,0
10
,1
2
2,4
51
-,6
0
3,1
30
1,3
126
-,8
0
,7
35
-11,0
486
1,2
0
-1,4
1
-,7
0
,1
1
1,5
10
1,2
2
-1,8
9
-,4
0
-2,0
2
1,9
64
-,5
0
-1,3
9
-2,1
316
-1,0
0
-,7
0
-,3
0
-,4
0
-1,0
0
-,4
0
-1,6
0
-,1
0
-1,1
0
-2,7
0
-,2
0
-1,4
0
23,5
223
-,4
3
26
3
6
43
6
114
1
53
350
2
97
2.478
0
-,8
48
20,5
0
-,3
0
-1,4
0
-,3
0
-,2
5
,6
0
-,4
0
-2,0
20
,2
0
-2,0
0
-,5
9
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
COMPAÑÍAS DE ALQUILER DE
VEHÍCULOS
TALLERES DE MECÁNICA, LATONERÍA Y
PINTURA Y SERVICIOS DE GRÚA
ALMACENES DE REPARACIONES
ELECTRÓNICAS
ALMACENES DE REPARACIÓN DE
ARTÍCULOS ELÉCTRICOS
AGENCIAS DE BOLETERÍA ( Producciones
de teatro ) EXCEPTO CINE
CASINOS, JUEGOS DE AZAR, LOTERÍAS Y
RIFAS
CONSULTORIOS Y SERVICIOS MÉDICOS
SERVICIOS DE RECREACIÓN
CLUBES SOCIALES Y DEPORTIVOS
TIENDAS DE ALQUILER DE VIDEOS
SALAS DE CINE
GARAJES Y PARQUEADEROS
INSUMOS INDUSTRIALES
244
-,2
Residuos tipificados
SERVICIOS DE SEGURIDAD
197
-,4
4
-,6
65
-4,1
246
-,6
62
-1,2
1
-,8
57
,4
1
-,1
1
-,4
31
-1,4
0
-4,9
32
,0
12
-,8
99
-1,4
0
,0
29
-1,2
119
-,9
23
-1,1
0
-1,6
18
-,5
0
-,7
0
-1,6
8
-,9
0
-3,6
11
-1,3
2
-,5
3
-,6
0
-2,2
0
-2,3
11
-2,1
0
-,5
0
-1,6
1
-,2
0
-,3
0
-1,5
0
-,4
0
19,5
49
-,9
0
-,2
187
1,1
6
-1,4
46
4,5
332
-3,7
27
2,2
6
2,1
66
,6
1
,1
1
,8
31
,3
2
-4,2
28
3,0
19
-,7
403
1,9
12
2,6
129
-12,9
192
7,4
172
,7
6
3,7
129
,0
1
-,5
1
2,7
68
1,2
5
-9,9
6
,3
19
2,1
182
-1,8
0
,2
47
22,4
537
-3,2
23
-,7
1
-4,3
14
-,7
0
1,5
2
-1,5
15
,6
2
-2,0
35
-1,7
3
-,7
5
-,7
0
-1,4
3
-3,8
10
-2,6
0
-,5
0
-2,5
0
-,3
0
-,3
0
-1,8
0
-,4
0
46,7
133
-1,1
0
-,3
1.085
22
319
1.467
307
14
290
3
5
153
9
342
55
2
-1,4
0
-,4
0
-1,4
19
-,5
0
-1,4
0
-,7
340
59,1
0
-,4
2
-1,7
0
-2,7
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
Recuento
Residuos tipificados
COLEGIOS, UNIVERS., INST. DE
EDUCACIÓN TECN. Y PREESCOLAR
ORGANIZACIONES DE SERVICIO SOCIAL
Y DE CARIDAD
ASOCIACIONES PROFESIONALES Y
GREMIOS
TOTAL
SERVICIOS PÚBLICOS
PAGO DE IMPUESTOS / PAGOS DE TDC
CONGRESOS Y SEMINARIOS
ESCUELAS DE ENSEÑANZA INFORMAL
MEDICINA PREPAGADA
LABORATORIOS CLÍNICOS
CLÍNICAS - HOSPITALES
42.239
-1,5
101
-3,8
63
-1,8
0
-14,0
162
-1,1
5
-1,4
23
,7
369
-,6
28
-,2
3
-1,9
67
-1,1
117
-2,6
245
Fuente: PASW 18.0.
2.542
-,6
Residuos tipificados
Recuento
6
Recuento
ÓPTICAS Y ARTÍCULOS ÓPTICOS
-1,4
Residuos tipificados
17.560
-,8
43
-2,0
29
-1,2
0
-6,9
97
-1,9
0
-1,1
9
-3,5
106
1,4
18
-1,2
0
-,4
33
-,5
50
,1
2.868
-2,8
0
-2,6
0
-,5
0
77,7
467
-,8
0
-1,5
0
-3,3
8
-1,5
0
-,5
0
-2,0
1
-2,6
1
-3,3
34.145
,6
100
-1,7
66
,8
4
-10,5
172
,9
9
1,0
30
-7,4
163
-1,1
20
-1,0
1
-,3
66
-2,5
79
-,3
62.205
2,5
205
4,5
203
2,4
10
-24,2
50
1,1
16
2,3
61
11,9
797
,4
49
2,4
10
4,8
178
7,1
288
2,9
27.846
1,1
87
4,0
99
-,8
1
-6,7
188
1,1
8
-,3
19
-5,9
144
1,8
29
-,8
1
-2,6
36
-4,4
45
2,1
4.105
-3,4
0
-3,1
0
-,6
0
89,6
646
-,9
0
-1,7
0
-1,6
25
-1,7
0
-,6
0
-1,5
4
-1,6
7
-3,8
193.510
536
462
15
2.122
38
142
1631
144
15
387
593
De lo anterior se puede concluir que por conglomerado los MCC más frecuentes se distribuyen de la siguiente
manera:
•
Conglomerado 1: Establecimientos comerciales más frecuentados: aerolíneas, compras en
Internet, transporte de carga en general, almacenes de computadores y software, entidades
financieras, hoteles y centros vacacionales, compañías de alquiler de vehículos y asociaciones
profesionales y gremios.
•
Conglomerado 2: Establecimientos comerciales más frecuentados: Contratistas generales,
residenciales y comerciales, almacenes por departamento sin supermercado, almacenes de
misceláneas, cacharrerías y artículos para regalo, supermercados y tiendas exprés, almacén
por departamento con supermercado, almacenes de vestuario y accesorios para toda la familia,
droguerías, farmacias, tiendas naturistas, mercadeo directo, servicios de seguros, mercadeo
directo, comerciantes de ventas telefónicas – DIRECTV y hoteles y centros vacacionales.
•
Conglomerado 3: Establecimientos comerciales más frecuentados: aerolíneas, almacenes por
departamento sin supermercado y supermercados y tiendas exprés.
•
Conglomerado 4: Establecimientos comerciales más frecuentados: sin nombre, compras en
Internet, almacenes de computadores y software, entidades financieras, compañías de alquiler
de vehículos y asociaciones profesionales y gremios.
•
Conglomerado 5: Establecimientos comerciales más frecuentados: venta de equipos y
servicios de telecomunicaciones, almacenes por departamento sin supermercado,
supermercados y tiendas exprés, almacén por departamento con supermercado y estaciones de
servicio (venta de gasolina y gas vehicular).
•
Conglomerado 6: Establecimientos comerciales más frecuentados: sin nombre, almacenes de
calzado, almacenes de electrodomésticos y gasodomésticos, librerías, aseguradoras, agencias
de boletería (producciones de teatro) excepto cine, ópticas y artículos ópticos y colegios,
universidades, institutos de educación tecnológica y prescolar.
•
Conglomerado 7: Establecimientos comerciales más frecuentados: servicios de ambulancia,
comprar en Internet, suscripción por cable y otros servicios de radio y T.V. pagos,
supermercados y tiendas exprés, almacén por departamento con supermercado, estaciones de
servicio (venta de gasolina y gas vehicular), almacenes de vestuario y accesorios para toda la
familia, mercadeo directo, servicios de seguros, mercadeo directo, comerciantes de ventas
telefónicas – DIRECTV y casinos, juegos de azar, loterías y rifas.
•
Conglomerado 8: Establecimientos comerciales más frecuentados: sin nombre, aerolíneas,
compras en Internet, transporte de carga en general, almacenes de computadores y software,
246
entidades financieras, hoteles y centros vacacionales, compañías de alquiler de vehículos y
asociaciones profesionales y gremios.
×
CON LOS CONGLOMERADOS RAM
Fuente: PASW 18.0.
Lo anterior implica que la prueba es significativa a un nivel 5%.
La tabla de contingencia entre los conglomerados RAM y los ocho conglomerados iniciales se presenta a
continuación. Los conglomerados RAM “-“ implican clientes que no cuentan con esta información. Los valores
sombreados con rojo indican los residuos tipificados más altos por variable, comparados contra el valor 25,02.
En los casos en los que los residuos tipificados no alcanzan a ser mayores a este valor, se buscan los valores
más altos por cada variable.
-
AAA
AAB
RAM
ABA
ABB
BAA
BAB
NÚMERO INICIAL DE CASOS
3
4
5
6
7
1
2
Recuento
107
2.103
879
144
1.772
2.977
1.468
218
Residuos tipificados
-1,8
-,2
,1
,1
1,6
-2,3
2,1
,9
Recuento
190
2.913
1.249
206
2.053
3.648
2.020
282
Residuos tipificados
1,9
3,3
3,2
1,5
-3,5
-6,1
5,0
1,0
Recuento
192
5.956
2.571
286
3.699
10.245
2.307
454
Residuos tipificados
-7,9
4,6
4,9
-4,9
-12,4
21,8
-22,9
-3,9
Recuento
253
6.313
2.671
362
5.665
11.158
2.719
556
Residuos tipificados
-6,9
-2,1
-,5
-3,7
5,9
16,5
-23,8
-2,9
Recuento
87
2.872
1.283
123
1.793
6.699
926
260
Residuos tipificados
-7,2
-3,5
,2
-5,9
-13,8
32,5
-24,4
-2,2
Recuento
444
4.197
1.682
367
3.391
3.872
5.303
418
Residuos tipificados
11,5
-1,5
-2,4
4,4
-1,4
-30,8
46,5
,0
Recuento
478
7.256
2.934
489
4.807
7.928
5.861
714
247
8
TOTAL
9.668
12.561
25.710
29.697
14.043
19.674
30.467
BBA
BBB
TOTAL
Residuos tipificados
3,9
7,4
3,2
1,8
-7,8
-18,9
22,3
2,7
Recuento
644
8.042
3.222
706
8.970
11.098
5.914
861
Residuos tipificados
5,5
-6,1
-6,0
5,0
24,1
-14,1
3,1
,8
Recuento
147
2.587
1.069
185
1.995
4.580
1.328
342
Residuos tipificados
-1,1
-1,6
-1,2
,3
-3,5
10,3
-10,3
5,1
Recuento
2542
42.239
62.205
27.846
4105
17.560 2.868 34.145
39.457
12.233
193.510
Fuente: PASW 18.0.
De lo anterior se puede concluir que por grupo, los conglomerados RAM más frecuentes se distribuyen de la
siguiente manera:
×
•
Conglomerado 1: Grupo RAM más frecuente: BAA y BBA.
•
Conglomerado 2: Grupo RAM más frecuente: BAB.
•
Conglomerado 3: Grupo RAM más frecuente: no presenta un parámetro relevante.
•
Conglomerado 4: Grupo RAM más frecuente: BBA.
•
Conglomerado 5: Grupo RAM más frecuente: ABA y BBA.
•
Conglomerado 6: Grupo RAM más frecuente: AAB, ABA, ABB, BBB.
•
Conglomerado 7: Grupo RAM más frecuente: AAA, BAA y BAB.
•
Conglomerado 8: Grupo RAM más frecuente: BBB.
CON LAS EDADES
Fuente: PASW 18.0.
Lo anterior implica que la prueba es significativa a un nivel 5%.
248
La tabla de contingencia entre las edades y los ocho conglomerados iniciales se presenta a continuación. Los
valores sombreados con rojo indican los residuos tipificados más altos por variable, comparados contra el
valor 25,02. En los casos en los que los residuos tipificados no alcanzan a ser mayores a este valor, se
buscan los valores más altos por cada variable.
NÚMERO INICIAL DE CASOS
1
2
3
4
5
6
7
8
Recuento
1
2
0
0
5
3
4
0
Residuos tipificados
1,8
-,7
-1,2
-,5
1,4
-,8
1,3
-,6
Recuento
99
2.493
962
128
2.782
4.490
1.355
113
Residuos tipificados
-5,0
-4,2
-4,9
-4,1
12,6
7,9
-10,2
-9,3
Recuento
797
12.422
5.276
936
10.802
19.315
7.473
1.250
Residuos tipificados
1,1
-2,6
-,2
2,5
5,1
4,3
-10,0
,4
Recuento
1218
21.586
9.042
1.372
16.200
30.453
14.702
2.119
Residuos tipificados
-1,5
3,3
2,9
-1,6
-6,6
-3,6
6,7
1,5
Recuento
375
5.086
2.026
366
3.832
7.013
3.759
538
Residuos tipificados
4,2
,9
-1,3
1,4
-3,5
-4,4
7,8
2,3
Recuento
39
539
212
48
432
783
454
61
Residuos tipificados
,9
-,9
-1,4
1,6
-1,0
-1,5
4,4
,9
Recuento
13
111
42
18
92
147
99
24
Residuos tipificados
2,2
-,7
-1,1
3,5
-,4
-2,2
2,3
3,6
Recuento
2.542
42.239
17.560
2.868
34.145
62.204
27.846
4.105
TOTAL
15
16-18
19-25
12.422
58.271
26-35
EDAD
96.692
36-55
22.995
56-70
2.568
>70
546
Empr.
TOTAL
193.509
Fuente: PASW 18.0.
De lo anterior se puede concluir que por grupo las edades más frecuentes se distribuyen de la siguiente
manera:
•
Conglomerado 1: Edad más frecuente: entre 56 y 70 años,
•
Conglomerado 2: Edad más frecuente: entre 36 y 55.
•
Conglomerado 3: Edad más frecuente: entre 36 y 55 años.
•
Conglomerado 4: Edad más frecuente: entre 26 y 35 años.
•
Conglomerado 5: Edad más frecuente: entre 19 y 25 años y entre 26 y 35 años.
•
Conglomerado 6: Edad más frecuente: entre 19 y 25 años y entre 26 y 35 años.
249
×
•
Conglomerado 7: Edad más frecuente: entre 35 y 55 años y entre 56 y 70 años.
•
Conglomerado 8: Edad más frecuente: entre 26 y 35 años.
CON LOS GÉNEROS
Fuente: PASW 18.0.
Lo anterior implica que la prueba es significativa a un nivel 5%.
La tabla de contingencia entre los géneros y los ocho conglomerados iniciales se presenta a continuación. Los
valores sombreados con rojo indican los residuos tipificados más altos por variable, comparados contra el
valor 25,02. En los casos en los que los residuos tipificados no alcanzan a ser mayores a este valor, se
buscan los valores más altos por cada variable.
0
E
SEXO
F
M
TOTAL
NÚMERO INICIAL DE CASOS
3
4
5
6
1
2
7
8
Recuento
0
0
0
0
0
1
0
0
Residuos tipificados
-,1
-,5
-,3
-,1
-,4
1,2
-,4
-,1
Recuento
13
111
42
18
92
147
99
24
Residuos tipificados
2,2
-,7
-1,1
3,5
-,4
-2,2
2,3
3,6
Recuento
1.075
21.580
9.069
1.243
17.369
31.810
14.339
1.683
Residuos tipificados
-6,0
1,0
1,7
-5,6
,4
1,4
1,8
-8,8
Recuento
1.454
20.548
8.449
1.607
16.684
30.246
13.408
2.398
Residuos tipificados
5,9
-1,0
-1,7
5,4
-,3
-1,3
-2,0
8,6
Recuento
2542
42.239
17.560
2.868
34.145
62.204
27.846
4.105
TOTAL
1
546
98.168
94.794
193.509
Fuente: PASW 18.0.
De lo anterior se puede concluir que por grupo los géneros más frecuentes se distribuyen de la siguiente
manera:
250
×
•
Conglomerado 1: Género más frecuente: masculino.
•
Conglomerado 2: Género más frecuente: femenino.
•
Conglomerado 3: Género más frecuente: femenino.
•
Conglomerado 4: Este grupo contiene empresas en su mayoría. Con respecto a las personas
naturales: Género más frecuente: masculino.
•
Conglomerado 5: Género más frecuente: no presenta un parámetro relevante.
•
Conglomerado 6: Género más frecuente: femenino.
•
Conglomerado 7: Género más frecuente: femenino.
•
Conglomerado 8: Este grupo contiene empresas en su mayoría. Con respecto a las personas
naturales: Género más frecuente: masculino.
CON LOS ESTADOS CIVILES
Fuente: PASW 18.0.
Lo anterior implica que la prueba es significativa a un nivel 5%.
La tabla de contingencia entre los estados civiles y los ocho conglomerados iniciales se presenta a
continuación. Los valores sombreados con rojo indican los residuos tipificados más altos por variable,
comparados contra el valor 25,02. En los casos en los que los residuos tipificados no alcanzan a ser mayores
a este valor, se buscan los valores más altos por cada variable.
251
7
8
Recuento
183
3.924
1.569
231
2.741
5.666
2.078
285
información
Residuos tipificados
-2,4
4,7
1,4
-1,0
-3,7
4,2
-6,6
-3,7
Recuento
901
14.078
5.915
1.018
12.182
21.381
8.886
1.396
Residuos tipificados
1,3
-2,3
-,7
1,4
5,4
1,7
-5,9
,0
Recuento
1.096
15.733
6.502
1.246
12.229
21.598
11.633
1.852
Residuos tipificados
4,9
,3
-,3
5,5
-4,0
-9,9
12,7
8,4
Recuento
74
1.401
542
69
1.120
1.952
986
98
Residuos tipificados
-,9
1,0
-1,0
-2,4
,6
-1,2
2,9
-3,0
Recuento
29
602
273
37
530
989
475
48
Residuos tipificados
-1,6
-1,9
,1
-1,1
,2
1,0
2,2
-1,9
Recuento
57
631
274
58
479
921
490
104
Residuos tipificados
2,8
-1,0
,0
2,0
-2,3
-1,5
2,7
5,0
Recuento
189
5.756
2.442
190
4.769
9.546
3.197
296
Residuos tipificados
-8,5
,0
1,0
-10,2
1,7
11,6
-9,7
-11,1
Recuento
0
3
1
1
3
4
2
2
Residuos tipificados
-,5
-,3
-,4
1,6
,1
-,5
-,2
2,9
Recuento
13
111
42
18
92
147
99
24
Residuos tipificados
2,2
-,7
-1,1
3,5
-,4
-2,2
2,3
3,6
Recuento
2.542
42.239
17.560
2.868
34.145
62.204
27.846
4.105
Casado
Separado
CIVIL
2
TOTAL
Sin
Soltero
ESTADO
1
NÚMERO INICIAL DE CASOS
3
4
5
6
Viudo
Divorciado
Unión libre
Religioso
Empresas
TOTAL
Fuente: PASW 18.0.
De lo anterior se puede concluir que por grupo los estados civiles más frecuentes se distribuyen de la
siguiente manera:
•
Conglomerado 1: Estado civil más frecuente: casado.
•
Conglomerado 2: Estado civil más frecuente: no presenta un parámetro relevante.
•
Conglomerado 3: Estado civil más frecuente: no presenta un parámetro relevante.
•
Conglomerado 4: Este grupo contiene empresas en su mayoría. Con respecto a las personas
naturales: estado civil más frecuente: casado.
•
Conglomerado 5: Estado civil más frecuente: soltero.
•
Conglomerado 6: Estado civil más frecuente: unión libre.
252
16.677
65.757
71.889
6.242
2.983
3.014
26.385
16
546
193.509
×
•
Conglomerado 7: Estado civil más frecuente: casado.
•
Conglomerado 8: Este grupo contiene empresas en su mayoría. Con respecto a las personas
naturales: estado civil más frecuente: casado.
CON LAS OCUPACIONES
Fuente: PASW 18.0.
Lo anterior implica que la prueba es significativa a un nivel 5%.
La tabla de contingencia entre las ocupaciones y los ocho conglomerados iniciales se presenta a
continuación. Los valores sombreados con rojo indican los residuos tipificados más altos por variable,
comparados contra el valor 25,02. En los casos en los que los residuos tipificados no alcanzan a ser mayores
a este valor, se buscan los valores más altos por cada variable.
NÚMERO INICIAL DE CASOS
3
4
5
6
1
2
Recuento
26
357
140
18
279
Residuos tipificados
,8
-,6
-1,0
-1,4
Servidor
Recuento
5
34
8
público
Residuos tipificados
2,4
,7
Recuento
1.278
Residuos tipificados
Ama de casa
Empleado
OCUPACIÓN Independiente
Pensionado
Religioso
Socio
7
8
547
286
31
-1,1
,2
2,8
-,8
2
18
49
19
2
-1,3
,0
-1,3
,7
-,2
-,5
27.628
11.597
1.737
22.052
41.716
16.991
2.332
-9,1
1,6
2,1
-2,8
-,4
7,1
-7,8
-6,3
Recuento
1.007
10.576
4.348
861
9.150
14.723
8.277
1.388
Residuos tipificados
13,5
-3,9
-3,2
4,2
2,9
-11,4
12,2
9,8
Recuento
67
1.154
488
62
907
1.658
880
98
Residuos tipificados
-,3
-,2
,3
-1,9
-1,0
-1,2
4,2
-1,4
Recuento
0
2
0
0
0
2
1
0
Residuos tipificados
-,3
,9
-,7
-,3
-,9
,3
,3
-,3
Recuento
11
86
35
6
67
104
90
23
Residuos tipificados
2,3
-,6
-,5
-,1
-,9
-2,7
3,8
4,7
253
TOTAL
1.684
137
125.331
50.330
5.314
5
422
Empr. y sin
Recuento
110
2.118
815
137
1.434
3.025
1.145
178
información
Residuos tipificados
-,7
3,7
,1
,4
-3,7
2,7
-4,0
-,9
Recuento
38
284
129
45
238
380
157
53
Residuos tipificados
4,9
-,3
,8
5,7
,3
-2,2
-2,4
4,7
Recuento
2.542
42.239
17.560
2.868
34.145
62.204
27.846
4.105
Estudiante
TOTAL
8.962
1.324
193.509
Fuente: PASW 18.0.
De lo anterior se puede concluir que por grupo las ocupaciones más frecuentes se distribuyen de la siguiente
manera:
•
Conglomerado 1: Ocupación más frecuente: independiente.
•
Conglomerado 2: Ocupación más frecuente: no presenta un parámetro relevante.
•
Conglomerado 3: Ocupación más frecuente: no presenta un parámetro relevante.
•
Conglomerado 4: Este grupo contiene empresas en su mayoría. Con respecto a las personas
naturales: ocupación más frecuente: estudiante.
•
Conglomerado 5: Ocupación más frecuente: independiente.
•
Conglomerado 6: Ocupación más frecuente: empleado.
•
Conglomerado 7: Ocupación más frecuente: independiente.
•
Conglomerado 8: Este grupo contiene empresas en su mayoría. Con respecto a las personas
naturales: ocupación más frecuente: independiente.
254
Descargar