MINERÍA DE DATOS ¿Por qué son importantes las Bases de Datos? Los diferentes mercados y tipos de organizaciones se ha requerido un mayor estudio referentes al descubrimiento de conocimiento y gracias a la integración de tecnologías como Minería de Datos con Inteligencia de Negocios es posible ofrecer de manera automatizada e inteligente información de suma importancia para ejecutar acciones para la solución de problemas organizacionales. La Minería de Datos es un proceso que permite obtener conocimiento a partir de los datos almacenados, mediante un proceso no trivial de extracción de información implícita, previamente desconocida y potencialmente útil. Descubrir conocimiento implica buscar patrones de comportamiento aún no conocidos en los datos. El conocimiento se puede manifestar como: patrones, reglas de conocimiento, asociaciones, grupos, restricciones, tendencias, etc. Los dominios de aplicación prácticamente abarcan cualquier campo y tipo de empresas (comercialización, producción, finanzas, energía, gobierno, tecnología, etc.) 2 Objetivos del curso Conocer de manera general las técnicas y enfoques de Minería de Datos Exploración y uso de fuentes de datos para análisis y toma de decisiones Comprender el proceso de la Minería de Datos para extraer conocimiento desde base de datos y la aplicación de estas técnicas a la solución de problemas de reconocimiento de patrones, clasificación y pronóstico. 3 Desarrollo del curso Durante el desarrollo del curso el instructor explicará cada uno de los temas, proporcionará ejemplos de aplicación en diversos campos y reforzará los conocimientos mediante ejercicios desarrollados en clase. 4 Instructor Act. Sonia Yoselin Ovando Retiz Actuario titulada por la Facultad de Ciencias de la UNAM enfocada a las áreas de Estadística, reaseguro y pensiones. En lo laboral: Ha impartido cátedra en la UNAM para el departamento de Matemáticas en materias como: Cálculo Diferencial, Geometría Analística, Estadística, Almacenes de datos y Minería de datos. Trabaja en HSBC como asesor de Análisis de Crédito, realizando las siguientes funciones: Desarrollo de estrategias de aseguramiento de la cartera de tarjetas de crédito basadas en el análisis estadístico, la minería de datos y mediciones de rentabilidad. Desarrollo de estrategias de gestión de cuentas para la cartera de tarjeta de crédito: las transferencias de saldo, cheques de conveniencia, de gestión de la línea de crédito, autorizaciones, etc. Desarrollo y automatización de seguimiento mensual para el seguimiento de las estrategias de originación y de suscripción Proporcionar datos para el análisis ad hoc sobre la cartera de tarjeta de crédito. Trabaja y conoce a un excelente nivel C++, Visual Basic, R, SAS 5 Temario 1. Introducción a minería de datos ¿Qué es minería de datos? ¿Porqué minería de datos? CRISP-SEMMA 2. Datos de procesamiento ¿Porqué procesar los datos? Limpieza de datos Manejo de datos missing Identificación de errores de clasificación Métodos graficos y outliers Trasnformación de datos Métodos numéricos y outliers 6 …Temario 3. Análisis exploratorio de datos Pruebas de hipótesis vs Análisis exploratorio de datos Conocimiento de los datos Correlación de variables Variables categóricas Relaciones multivariadas Selección de subconjuntos de datos Binning 4. Estimaciones y pronósticos Descubrimiento de conocimiento en los datps Estimación y pronóstico Métodos univariados Inferencia estadística 7 …Temario Intervalos de confianza Peligros de la exploración Regresión multiple Verificación de los supuesto del modelo 5. Algoritmo k-nearest neighbor Métodos supervisados vs no supervisados Metodología para modelos supervisados Sesgo-varianza Clasificación k-nearest neighbor Función distancia Otras funciones Cuantificación de relevancias 8 …Temario Algoritmo k-nearest neighbor para estimación y pronóstico Elegir k 6. Árboles de decisión Árboles de decisión y regresión Algoritmo C4.5 Reglas de decisión Algoritmo CART vs C5.0 7. Redes neuronales Codificación de entradas y salidas Redes neuronales para estimacaión y pronóstico Ejemplos simples Función sigmoid 9 …Temario Retropropagación Método gradient descent Reglas de retropropagación Ejemplos de retropropagación Criterio de terminación Tasa de aprendizaje Análisis de sensibilidad Aplicación 8. Clustering Clustering Método jerárquico K-means Ejemplo 10 …Temario 9. Reglas de asociación Affinity analysis and market basket analysis Soporte, confianza, frecuencias y propiedades a priori Generación de frecuencias Generación de reglas de asociación Datos categoricos Método de inducción de reglas generalizadas Cuando no usar reglas de asociación Reglas de asociación y aprendizaje supervisado o no supervisado Patrones locales vs modelos globales 10. Técnicas de evaluación Modelos de evaluación para descripción Modelos de evaluación para estimación y pronóstico Modelos de evaluación para clasificación 11 …Temario Tasa de error, falsos positivos y falsos negativos Misclassification Análisis de decisión costo/beneficio Lift and gains charts Validación de modelos Conclusiones 12 Dinámica El curso se realizará en un ambiente práctico, de manera que es importante que los participantes puedan llevar una laptop. 13 Información general del curso Duración: 40 horas Lugar: Tlaxcala No. 67 1er. Piso, Col. Roma Sur, Del. Cuauhtémoc C.P. 06760 México, D.F. (están justo en la esquina de Tlaxcala y Medellín) Horario: 11:00 a 15:00 horas Inicio Sábado 25 de octubre de 2014 Fin Sábado 24 de enero de 2015 14 Ubicación Tlaxcala 67 101, Col. Roma Sur, Del. Cuauhtémoc, C.P. 06760 15 Inversión Empresas y facturación (cualquier forma de pago) $ 4,999 + IVA Efectivo $ 3,999 Aparta tu lugar con $1,000 y liquídalo antes de que comience el curso Cupo limitado 16 Garantía Asiste a la primera sesión y si no es de tu agrado, te devolvemos el importe de tu apartado Si decides tomar el curso completo, puedes pagar el importe total en la primera sesión o pactar un esquema de pago que vaya acorde a tus posibilidades . Limitado a disposición de lugares. 17 Inscripciones e Informes 1. 2. 3. 4. Solicitar por correo electrónico o vía telefónica las formas de pago. Enviar el comprobante de pago vía correo electrónico a la dirección de correo informes@actuaryhunters.com indicando el nombre completo, teléfono y datos fiscales anexando su RFC (en caso de requerir factura) Una vez enviados los datos anteriores se confirmara la inscripción y depósito vía correo electrónico. El reembolso solo se realizará 15 días antes de iniciar el curso y únicamente se devolverá el 70% de la inversión realizada hasta ese momento. Informes: informes@actuaryhunters.com gaviles@engineerhunters.com Tels. 5171-6286, 4329-0443, 4331-9873 18