SUPERFICIE DEL CEREBRO MAPAS AUTO-ORGANIZADOS Gustavo Meschino © 2005 SOM – ALGORITMO SOM Parámetros de Entrenamiento Cada celda tiene asociado un vector. Las componentes de este vector son los pesos, análogos a otros tipos de redes neuronales. El conjunto de vectores se denomina Codebook. CÁLCULO DE BMU Vector del que se quiere conocer la BMU. Vectores del codebook. FÓRMULA DE ACTUALIZACIÓN DE CODEBOOK Función vecindad. Distancia entre codebook y dato de entrenamiento.. SOM – TIPOS DE CELDAS U-MATRIX Celdas Originales del mapa Representación de la distancia entre dos celdas adyacentes según un código de color (o de grises). La U-Matrix permite detectar agrupamientos en los datos según las distancias entre los codebooks de celdas adyacentes. 1 CLASIFICACIÓN DEL CONJUNTO IRIS.DATA CLASIFICACIÓN DEL CONJUNTO IRIS.DATA Sepal length in cm Sepal width in cm Petal length in cm Petal width in cm Class 5.1 4.9 4.7 4.6 5.0 5.4 4.6 5.0 4.4 4.9 5.4 4.8 4.8 4.3 5.8 3.5 3.0 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 3.7 3.4 3.0 3.0 4.0 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 1.5 1.6 1.4 1.1 1.2 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 0.2 0.2 0.1 0.1 0.2 1 1 1 1 1 1 2 2 2 2 3 3 3 3 3 CLASIFICACIÓN DEL CONJUNTO IRIS.DATA “CHURN” DE UNA EMPRESA DE TELEFONÍA Churn: Término que describe la infidelidad o falta de lealtad de los clientes. Una tasa de churn alta indica una gran deslealtad de los clientes. | Otra definición: “The cancellation of online, cell phone or other subscription in order to switch to another service.” | “CHURN” Conjunto de datos disponible | | | | | | | | | | | | | | | | | | | account length area code phone number international plan voice mail plan number vmail messages total day minutes total day calls total day charge total eve minutes total eve calls total eve charge total night minutes total night calls total night charge total international minutes total international calls total international charge number customer service calls continuous. continuous. discrete. discrete. discrete. continuous. continuous. continuous. continuous. continuous. continuous. continuous. continuous. continuous. continuous. continuous. continuous. continuous. continuous. No se sabe que indica Se descarta Zona “Peligrosa” de potenciales clientes que se irán de la empresa. 2 Estos clientes efectúan las mayores cantidades de llamadas internacionales. Estos clientes tienen pocas llamadas internacionales. CONCLUSIONES Clientes con valores altos de minutos en llamadas internacionales. Estos clientes tienen pocas llamadas internacionales, pero altas en minutos. ANÁLISIS DE PACIENTES DIABÉTICOS INTERNADOS Los clientes probables de abandonar la empresa son los que realizan gran cantidad de llamadas internacionales o bien llamadas internacionales largas. | Hablan preponderantemente durante el día más que de noche. | Debe replantearse el servicio que ofrece la empresa de llamadas internacionales. | Análisis de la variable “Costo Institucional” Matriz de distancias con interpolación conjuntamente con los motivos de internación. de intensidades de niveles de gris. PACIENTES DIABÉTICOS Factores de Riesgo PACIENTES DIABÉTICOS Variables Socio-culturales 3 RIESGO BANCARIO Variables de los Datos RIESGO BANCARIO Clasificación y zonas del mapa Zona de Bancos sin riesgo Variables: Ratios Económicos, Capital, Efectivo, Liquidez, etc. Casos de consulta del mapa Resultado: Quiebra (1) o Solidez (0) Zona de Riesgo Bancario RIESGO BANCARIO 4