El análisis inteligente de datos ¿qué revelan nuestros clientes? Aplicación de herramientas de Big Data con enfoque en Marketing Relacional Presentado por: Víctor Manuel Hoyos V. Business Analytics & Data Science victor.hoyos@idata.com.co El valor de la información… Fuente: iDATA Fuente: iDATA aplican cómo área call 0 pre opción inversiones fila altura meta qué tipo firma bienvenida programa banco calles davivienda cobran sede sucursal debo col linea cliente informe aplica monteria jajaja contarnos operar sec ponele octubre colombia fiscalíalínea BBVA ofrecer extensión recinto sale favor mínimo detalles millones fallo lanza Cajapermite Social liquidez verificar cauca clave alista mantener clientes regional excelente manejo señores premio generando situación min Falabella llegada alegra importantes dinero bajas presenta diva proceso informaciónempresas reportes validar destapa 5 vida esprit oscar valle meses encargada 10 debería pruebas caso feliz están podrás bursátil Banco día alma panamá decida comisiones noticias podrá asesor Bancolombia hacienda ayudarte condiciones datos donaciones n=28 scb alla cop está minimo plata etrading comisión crecimiento bpd depende plataforma confirma Caja Social Frecuencia importante norte difusión 0 15 virtual mercado asíacceso comunícate 10 vemos cali baja antioquia amex hsbc caracol BBVA 20 denunciarán agosto descuento sirven crédito global n=117 bancolombiaetrading importaciones tarjeta saludos enfirme eeb finanzas trading bvc cobrará disfrutar hablar vol colombiano 30 correval compra 0 mundo tarifasbvc cajeros gracias facilitar concluiría 50 servicio cuéntanos jpcórdoba 100 departamental n=499 Bancolombia 150 miércoles secretaria minimos tienes externos exclusivo inversores movilidadmedellín diferencia supervisores estudiando quieran proceder guainiz colcap ciudad jugador escándalo rubiales busca fajardo banistmo informeespecial tengas negocio operación amplia naturales opinión etraidi administración remitiremos presentación hipotecaria banbogotá página poniendo financiero especiales productos costo ingresa consultar esperaba seguros coyuntura dataifx minuto peso privilegios económico cola aún grupo norma tarifas cobro amplíanos Pichincha portafolio vivienda felicita superfinanciera industria anteriormente seguridad interesados campo pesos revisarán presidente sucursales laboral contestado lanzamiento respuesta hijueputas protesta n=155 proyección ecopetrolempresa necesitas esperando hablarle Falabella 40 20 reporte Figura 2. Worcloud para @Bancolombia_ Tabla 1. Score Social para los principales Bancos. 0 n=135 Pichincha 30 pensar 20 10 0 -7.5 -5.0 -2.5 0.0 2.5 5.0 Score Figura 1. Distribución de Sentimientos Positivos y Negativos. Fuente: iDATA queso clientes comienza Mi Planeta lunes espacio Grupo puntosexito mañana historiacarulla Planeta puntos personas Móvil tarjeta deseamos revelatuinterior Viajes VIVA vivolamoda niños regalo martes energía barranquilla naturaleza nutrición calle cómo interior disfrutar feliz día días infancia amistad ley dúo compra bebés porta salón ofrecen sueños energías situación sabías mundo caso gusta bogotá amor ciudad inscríbete unbuenquesoexpress venta vigilante modaasí colombianos arte saludable libre colección cuéntanos villavicencio tendencias disfruta viveelmomentodisfrutomiexito bolsas busca comenzar ofrecerte prosperidad Mi años noche invitamos colombia nacional desarrollo Carulla estilo vida producto versión exito.com empleos Grupo n=98 país álbum alimentos n=2 carulla públicas río abrimos compromiso salondelqueso historiaexito descansar confidenciasaf servicio almacén Almacenes wkd plan n=371 feria año color fundacionexito esperamos Usuario almacenes marca éxito aprovecha prendas salud bucaramanga infantil expertos mesdelbebe mes semana evento cadena mano surtimax empleados inauguramos gustavo artistas exito.com n=29 bebé atención productos medellín leche sonrisa desplaza inauguración puedes octubre parque familia septiembre bronziniandyouintegral aniversario dormir cumpleaños primerainfancia experiencia inauguró seguro ropa contiene adecuamos cumple marzo concepto formato proveedores quesos sábado participa n=235 goticas grupo comprometes planeta puertas toque ilustraciones you fiebremundialista celebrar colores catalina n=714 Carulla Frecuencia Almacenes Móvil 250 200 150 100 50 0 80 60 40 20 0 10.0 7.5 5.0 2.5 0.0 80 60 40 20 0 2.0 1.5 1.0 0.5 0.0 20 15 10 5 0 6 comodidad ganas directorio sonrisas compartir llamado cambiojeans miplanetaexito incendio encanta programa centro compañía apertura programación conoce llega socorro recomendable sanamejores domingo bronzini apoyamos Figura 2. Worcloud para @Grupo_Exito Tabla 1. Twitscore para las cuentas Grupo Exito. Viajes n=13 4 2 0 n=193 VIVA 60 40 20 0 -4 0 4 Score Figura 1. Distribución de Sentimientos Positivos y Negativos. Fuente: iDATA Metodologías analíticas Decisiones acertadas y rentables Preguntas de Negocio Conocimiento profundo del negocio Comisionistas Banca Retail Salud Energía / Comunicaciones Logística Big Data vs Small Data Ecosistema Analítico Despliegue / Consumo / BI Analítica Avanzada ETL Infraestructura de Datos Equipo Analítico “Científico de datos: aquel que es mejor estadístico que un ingeniero de sistemas y que es mejor ingeniero de sistemas que cualquier estadístico” Grandes compañías buscan estos perfiles ¿Utopía? Contenido 1. Caso de negocio sector retail 2. Proceso de inteligencia analítica 3. Resultados y principales hallazgos 4. Ejemplos de aplicaciones 5. Conclusiones Antecedentes Entre los principales interrogantes para diseñar estrategias de mercadeo de alto impacto es conocer ¿qué características tienen los clientes? ¿Cómo están segmentados? ¿Cómo me comunico con ellos? Y de qué manera genero valor para la organización. Lo anterior mediante el uso de herramientas estadísticas y bajo un esquema AAS (Analytics As Service). Analytics 3D: Encontrando los diamantes… ¿Utopía? Cliente Almacén Vendedor Mediante un análisis de clustering conjunto se identifican características propias en puntos de venta (Almacenes), efectividad de la fuerza comercial (Vendedores) y preferencias de compra del consumidor (Cliente); como resultado se direccionan estrategias que parten del análisis de datos transaccionales, demográficos y del negocio para más de 678 mil clientes y más de 120 almacenes en todo el país. Proceso de inteligencia analítica Caso 1: Ficha técnica de la solución Big data • • • • • • • • • • • Unidad de medida: cliente, almacén y vendedor Bloques de información: identificación, demográficos, contacto, transaccional Ventana de tiempo utilizada: últimos 7 años Métodos estadísticos: clúster bietápico, árboles de clasificación, GLM Sistema de información: POS – CRM Base de datos procesada: SQL Postgresql Tablas Maestras: 37 Cantidad de registros: 57 millones de transacciones Clientes únicos: 678.000 Almacenes: 170 Vendedores: 254 • Herramienta de Minería de Datos: Knime + R Stats • Herramienta de visualización y BI: Qlikview Arquitectura de la solución Big data Se analizaron 37 tablas y 57 millones de registros sólo del Sistema POS Se consolida un único archivo de análisis con 47 variables y 8.3 millones de registros únicos Almacenes 170 La información de clientes se caracteriza en tres bloques: Identificación, Demográfico, Contacto y Transaccional Fueron analizados datos transaccionales desde julio de 2006 hasta diciembre de 2015 para 170 almacenes Se analiza la composición y relación de ventas de cada marca con todas las demás franquicias asociadas sobre un total de 678 mil clientes únicos Cliente 818 mil Marcas 14 Facturación 7.4 mills Líneas 9 Vendedores 254 Resultados y principales hallazgos Dimensión 1: árbol de clientes Clientes 678.568 Inactivos 211.987 Platino Activos 467.581 Segmento Plata Nuevos Platino Antiguos Oro Segmento Plata Bronce Oro Bronce VARIABLES SIGNIFICATIVAS • Recencia • Frecuencia • Monto • Temporalidad • Antigüedad • Contactabilidad • Venta Cruzada Dimensión 2: Almacén Almacen es 170 LÍNEA 110 A OUTLETS 60 B E Segmento C F Segmento D G H VARIABLES SIGNIFICATIVAS • Tipo de almacén • Ubicación • Marcas asociadas • Ventas mensuales • Ventas semestrales • Ventas anuales • Rotación de inventario Dimensión 3: Vendedor Vendedores 254 NUEVOS 120 A ANTIGUOS 154 B E Segmento C F Segmento D G H VARIABLES SIGNIFICATIVAS • Tipo de vendedor • Antigüedad • Clientes nuevos • Clientes inactivos • Ventas mensuales • Ventas semestrales • Ventas anuales Automatización del proceso en Knime + RStats Ruta en KNime Algoritmos de minería de datos Automatización del proceso en Knime + RStats Ejemplos de aplicaciones Caso 1: Lanzamiento del Producto Identificación del Perfil del Producto - Segmento Género Material Colores Análisis del Mercado Objetivo del Producto - Edad Ubicación Almacenes Género Análisis del Mercado Efectivo del Producto - Clientes activos - Compradores con el perfil del producto - Frecuencia alta de Compra Caso 2: Campaña de Recuperación de Clientes Selección de Nichos - Clientes Recencia > X Tiempo - Monto Promedio ≥ X $ - Frecuencia ≥ 1/3 meses Árbol de Productos - Selección de Productos Segmentados Accionamiento de Estrategia Caso 3: Campaña SALE 5. Conclusiones Se han estimado ahorros en costos por un 14% respecto al año 2014. Se ha aumentado la rotación de inventarios en un 8%. El indicador de calidad se ubica en un 75% con corte a junio de 2015. Se ha tenido una disminución del 15% en el ingreso de correos electrónicos con respecto al corte de diciembre de 2014. Ha habido un incremento del 7% en clientes nuevos con respecto al indicador con corte a diciembre de 2014. Se han inactivado el 26% de los clientes activos-antiguos en comparación al cierre de 2014. El principal problema en la identificación de clientes únicos radica en la mala digitación de los vendedores ubicados en las ciudades de Medellín y Bogotá. Para las campañas SALE desarrolladas vía email y SMS entre enero y marzo de 2015 se generó un impacto positivo al 17,5% de la base de datos seleccionada. El proceso de transmisión de archivos mensual está totalmente automático. La herramienta de consulta de clientes permite exportar y seleccionar grupos de clientes con base en el árbol de clasificación definido en la etapa de análisis. Gracias!