(Minería de datos).

Anuncio
SISTEMAS DE
INFORMACION
GERENCIAL
LIC.PATRICIA PALACIOS ZULETA
Qué es inteligencia de negocios? (BI)
Business Intelligence es la habilidad para transformar los
datos en información, y la información en conocimiento, de
forma que se pueda optimizar el proceso de toma de
decisiones en los negocios.
I
Conocimiento
Informacion
Datos
Desde un punto de vista más pragmático;
Asociándolo directamente con las tecnologías de la
información, podemos definir Business Intelligence como el
conjunto de metodologías, aplicaciones y tecnologías que
permiten reunir, depurar y transformar datos de los sistemas
transaccionales e información desestructurada (interna y
externa a la compañía).
Características del BI
 Enfocada en Información:
Diseñada para investigación y exploración de los datos por parte
del usuario final, no es transaccional.
 Interactiva:
Capaz de aceptar u actuar sobre consultas de usuario.
 Agregación Dinámica:
Agregación de datos en tiempo real. visualizar los procesos
operativos y las metas de negocio conforme se vayan realizando.
 Navegación:
Habilidad de movimiento entre los niveles de granularidad de
datos.
 Segmentación: Habilidad para combinar y re combinar
varias dimensiones para obtener nuevas facetas de
información.
 Pivote: Habilidad de ofrecer comparaciones, revelar
patrones y relaciones, analizar tendencias.
 Rendimiento: Acceso y manipulaciones de datos se deben
llevar a cabo a la "velocidad del pensamiento".
Por otro lado, los principales componentes de orígenes de datos en el
Business Intelligence
Son:
 Datamart
 Datawarehouse
Los sistemas y componentes del BI se diferencian de los sistemas
operacionales en que están optimizados para preguntar y divulgar
sobre datos..
Características de una Data Warehouse
Orientado a temas.- Los datos en la base de datos están
organizados de manera que todos los elementos de datos
relativos al mismo evento u objeto del mundo real queden
unidos entre sí
Variante en el tiempo.- Los cambios producidos en los datos a
lo largo del tiempo quedan registrados para que los informes
que se puedan generar reflejen esas variaciones
No volátil.- La información no se modifica ni se elimina, una
vez almacenado un dato, éste se convierte en información de
sólo lectura, y se mantiene para futuras consultas
Integrado.- La base de datos contiene los datos de todos los
sistemas operacionales de la organización, y dichos datos
deben ser consistentes
ESTRUCTURA DE UNA DATA WAREHOUSE
Staging Area
Es un área temporal donde se recogen los datos que se necesitan
de los sistemas origen. Se recogen los datos estrictamente
necesarios para las cargas, y se aplica el mínimo de
transformaciones a los mismos.
ODS (Operational Data Store)
Como su nombre indica, este area es la que va a dar soporte a los
sistemas operacionales. El modelo de datos del Almacén de Datos
Operacional sigue una estructura relacional y normalizada, para
que cualquier herramienta de reporting o sistema operacional
pueda consultar sus datos.
Almacén de Datos Corporativo
El Almacén de Datos Corporativo sí que contiene datos históricos, y
está orientado a la explotación analítica de la información que
recoge. Las herramientas DSS o de reporting analítico atacarán
principalmente a los Data marts, pero también se pueden realizar
consultas directamente contra el Almacén de Datos Corporativo,
sobretodo cuando sea necesario mostrar a la vez información que se
encuentre en diferentes Datamarts.
Data marts
Éstos se obtienen a partir de la información recopilada en el área
del Almacén Corporativo. Cada Data Mart es como un
subconjunto de este almacén, pero orientado a un tema de
análisis, normalmente asociado a un departamento de la empresa.
CUBOS OLAP (HIPERCUBOS)
TIENEN N DIMENSIONES Y N MÉTRICAS
Ver: tabla-dinamica-tipo-cubo-olap
UN cubo OLAP (OnLine Analytical Processing es una
base de datos multidimensional, en la cual el
almacenamiento físico de los datos se realiza en vector
multidimensional. Los cubos OLAP se pueden
considerar como una ampliación de las dos dimensiones
de una hoja de cálculo.
Cubo OLAP de 3
dimensiones
(productos ciudades y
tiempo)
Se conoce como Data Mining o Minería de Datos al proceso no
trivial de análisis de grandes cantidades de datos con el objetivo de
extraer información útil, por ejemplo para realizar clasificaciones o
predicciones, obtener conclusiones y tomar decisiones estratégicas.
Elementos que conducen al resultado esperado:
Sistemas
Operacionales
Procesos de
Integración
Procesos de
clasificación
Procesos de
consolidación
Herram. BI
Datos Operacionales
Data warehouse
Data Marts
KPI
Sistemas Operacionales:
Sistemas concebidos para mejorara la
eficiencia
Datos Operacionales:
Conjunto de archivos de datos que generan los
procesos operacionales
Procesos de Integración:
Generan un Almacén de Datos que yace en una
plataforma común.
En definitiva, una solución BI completa permite:
Observar ¿qué está ocurriendo?
Comprender ¿por qué ocurre?
Predecir ¿qué ocurriría?
Colaborar ¿qué debería hacer el equipo?
Decidir ¿qué camino se debe seguir
Cuales son los beneficios?
REDUCCION DE COSTOS
Imagínese que usted tiene el control
real de los inventarios, Usted sabe
exactamente que almacén o que
sucursal le está costando más.
PRONOSTICO ACERTADOS
Con la información precisa Usted
puede anticiparse a la competencia y
generar mejores procesos operativos.
CONOCE MEJOR A SUS CLIENTES
En BI Usted puede analizar tendencias
de ventas e influencias de las
campañas de publicidad.
Cómo funciona el concepto de BI
o modelo conceptual del BI?
3. Explotación
de la
Información
1. Integración
de Datos
Datos
Externos.
Datos
Operativos
Sistemas
ERP, CRM
Supply Chain
Metodología .
Extracción
Transformación y
Carga .
Calidad de Datos
Datos de
Sistemas
legados.
2.
Consolidación
de Datos
Análisis de
Ventas e
Inventarios
Reportes
ODS/DW
Administración de
Metadatos.
DM
Data Mart
de Ventas.
DM
Data Mart
Financiero.
ODS / Data
Warehouse con
Modelo de Datos
Consultoría y
Entrenamiento
Datos de
Web site
Tableros de
Control
Análisis de
Marketing
Data Mining
Pronósticos
En la fase del diseño conceptual existen varios momentos en el
desarrollo de una plataforma de Inteligencia
de negocio como:
1. Construcción del datawarehouse y datamarts: se construye
el almacén de datos y después se alimenta con todos los datos
históricos que se encuentran en los otros sistemas.
2. Implantación de herramientas de soporte a la alta
dirección: se hace un análisis estratégico de la entidad
identificando misión, objetivos estratégicos, factores de
seguimiento, indicadores clave de gestión o KPIs.
3. Consultas y Reportes: Son herramientas para la
elaboración de informes y listados, tanto en detalle
como sobre información agregada, a partir de la información
de los datawarehouses y datamarts.
4. Cuadro de mando analítico (EIS tradicionales): Es
elaborado a partir de datamarts, informes,
resúmenes e indicadores clave para la gestión (KPI, Key
Performance Indicators), que permitan a
los gestores de la empresa analizar los resultados de la misma
de forma rápida y eficaz. En la
práctica es una herramienta de consulta orientada a la
obtención y presentación de indicadores para
la dirección (frente a la obtención de informes y listados).
5. Cuadro de mando integral o estratégico (Balanced
Scorecard): Este modelo parte de que la
estrategia de la empresa es el punto de referencia para todo
proceso de gestión interno. Con él los diferentes niveles de
dirección y gestión de la organización disponen de una visión
de la estrategia de la empresa traducida en un conjunto de
objetivos, iniciativas de actuación e indicadores de
evolución. Los objetivos estratégicos se asocian mediante
relaciones causa-efecto y se organizan en cuatro áreas o
perspectivas: financiera, cliente, procesos y formación o
desarrollo. El cuadro de mando integral es una herramienta
que permite alinear los objetivos de las diferentes áreas o
unidades con la estrategia de la empresa y seguir su
evolución.
5. OLAP (on-line analytical processing). Herramientas que
manejan interrogaciones complejas de bases de datos
relacionales, proporcionando un acceso multidimensional a
los datos, capacidades intensivas de cálculo y técnicas de
indexación especializadas. Permiten a los usuarios analizar
sus datos planteando consultas sobre diferentes atributos o
ejes. Utilizan un servidor intermedio para almacenar los datos
multidimensionales pre-calculados de forma que la
exploración sea rápida.
6. Datamining (Minería de datos). Son auténticas herramientas de
extracción de conocimiento útil, a partir de la información
contenida en las bases de datos de cualquier empresa. El objetivo
que se
persigue es descubrir patrones ocultos, tendencias y correlaciones, y
presentar esta información de forma sencilla y accesible a los
usuarios finales, para solucionar, prever y simular problemas del
negocio. El datamining incorpora la utilización de tecnologías
basadas en redes neuronales, árboles de decisión, reglas de
inducción, análisis de series temporales y visualización de datos.
Entendiendo la Relación entre OLAP y Minería de los Datos
OLAP y minería de datos son las tecnologías analíticas
importantes,
La familia de OLAP , está bueno en agregar una cantidad
grande de datos de la transacción basado en las definiciones
de la dimensión. Lo siguiente es algunas preguntas típicas
contestado por OLAP:
Las ventas totales, son la suma de productos de la bebida en
los tres meses en la región Noroeste
Los 10 productos mas vendidos en todas las tiendas en el
mes pasado.
Cuales son los 10 productos mas comprados ya sea por los
Hombre y la Mujeres
La minería de datos es bueno para encontrar los modelos
ocultos
Considerando que la mayoría de las técnicas de OLAP viene
de la familia de la base de datos, la minería de los datos, las
técnicas vienen de tres campos: las estadísticas, el
aprendizaje de la máquina, y tecnología de la base de datos.
Uno de los procesos fundamentales de minería de datos es analizar
las correlaciones entre los atributos y sus valores.
La vista correlativa de un OLAP el modelo minero
EJEMPLO:
Un
QUE UTILIZA EL USUARIO?
donde se
monitor Empresarial vía Intranet / Internet
indicadores de la empresa
analizan los principales
Un Monitor para cada necesidad?
•Ventas
•Logística y Distribución
•Marketing
•CRM Analityc
•Manufactura
•Finanzas
•Supply Chain
•Health Care
•Police and law enforcement
•Gobierno
•Telco
•Call Centers
•Oil and IT
•Industria Eléctrica
Descargar