PROYECTOS DE INGENIERIA DE SISTEMAS I “Implementación de un Aplicativo Web Denominado Ext Solutions (Aplicativo de Reportes Genéricos)” Docente: Ing. Wilmer Perfecto Manrique Integrantes: Huamán Flores, Junior Hernando Otiniano Uchida, Mariano Alberto 29 de Febrero del 2012 LIMA - PERU Implementación de un Aplicativo Web denominado como Ext Solutions (Aplicativo de Reportes Genéricos), que mediante el uso de Tecnologías y Metodologías de Business Intelligence me Generará Reportes Dinámicos de la Situación Financiera de una Organización que formará parte de un Sistema de Reportes en Línea, orientado a la gestión de la información registrada por el ERP – OSIS. 2 INDICE INTRODUCCION………………………………………….…………………………………………………... 4 CAPITULO I: EL PROBLEMA 1.1. Planteamiento del Problema …………………………………………………………………… 5 1.2. Formulación del Problema ………………………………………………………………………. 6 1.3. Objetivos .……………………………………………………………………………………………….. 8 1.4. Justificación de La Investigación …….………………………………………………………… 10 1.5. Limitaciones …………………………………………………………………………………………….. 10 CAPITULO II: MARCO TEORICO 2.1. Antecedentes de La Investigación ……………………………………………………………. 11 2.2. Bases Teóricas …………………………………………………………………………………………. 14 2.3. Definición de Términos ……………………………………………………………………………. 48 2.4. Sistema de Hipótesis ………………………………………………………………………………… 52 2.5. Sistema de Variables ………………………………………………………………………………… 54 CAPITULO III: MARCO METODOLOGICO 3.1 Nivel de Investigación …………………………………………………………………………….. 55 3.2 Diseño de la Investigación .…………………………………………………………………….. 55 CAPITULO IV: ASPECTOS ADMINISTRATIVOS 4.1 Recursos: Humanos, Materiales, Financieros …………………………………………… 56 4.2 Cronograma de Actividades. Diagrama de Gantt ………………..…………..……. 59 4.3 Análisis Económico-Financiero del Proyecto ………..…………………………….….. 60 BIBLIOGRAFÍA .………………………………………………………………………………………………… 63 ANEXO .…………………………………………………………………………………………………………… 64 3 INTRODUCCION Con la llegada de la tecnología informática en el ambiente empresarial, han surgido en los últimos años diversos sectores específicos para el control y administración de la información relevante relacionada con los procesos productivos, con el fin de optimizar el total de las operaciones de una organización comercial. Tal es el caso del sistema denominado Business Intelligence, que como su nombre lo indica basa su función en la inteligencia al servicio de los negocios, y desde hace años es uno de los métodos más utilizados para mejorar los procesos productivos y los resultados obtenidos por las empresas. Básicamente, la función del Business Intelligence reside en transformar los datos que se obtienen a lo largo de la cadena de producción y distribución de los productos, en información confiable, que luego será transformada a su vez en conocimiento, que permitirá a los sectores gerenciales llevar a cabo correctas tomas de decisiones en los futuros negocios que emprenda una compañía. Para que esto sea posible, Business Intelligence o BI utiliza las más modernas tecnologías informáticas para la administración de la información, por lo que suele definírselo como un conjunto compuesto por las metodologías, las aplicaciones y las tecnologías que se utilizan para gestionar la información. Mediante la implementación de un sistema BI es posible recabar los datos desestructurados, tanto internos como externos a la empresa, para luego depurarlos y posteriormente transformarlos en información homogeneizada. 4 CAPÍTULO I: EL PROBLEMA 1.1. PLANTEAMIENTO DEL PROBLEMA Gestionar la información en las empresas es, hoy en día, una herramienta clave para poder sobrevivir en un mercado cambiante, dinámico y global. Aprender a competir con esta información es fundamental para la toma de decisiones, el crecimiento y la gestión de una empresa. La disciplina denominada como Business Intelligence se acerca a los sistemas de información que ayudara la toma de decisiones en una organización. La pyme dispone, como todas las empresas, no importa su tamaño, de sistemas de información más o menos sofisticados y que es conveniente analizar y optimizar. Es así que, el siguiente proyecto pretende desarrollarse en la empresa OSIS S.A., una empresa consultora en tecnologías de Información - TI, que tiene como objetivo central el brindar soluciones basadas en la mejora de procesos y en el uso de TI. Y que brinda diversos productos y servicios entre ellos el ERP – OSIS, que como su mismo nombre lo dice es un sistema ERP para pequeñas y medianas empresas (PYMES). El ERP – OSIS cuenta con una gran variedad de reportes fijos con filtros personalizados los cuales no pueden ser configurados por los usuarios solo por el proveedor del sistema y no cuenta con reportes ejecutivos o de alto nivel para la obtención de información resumida en web. Y los usuarios del ERP-OSIS, no cuentan con una herramienta configurable y personalizada en línea para elaborar sus reportes de gestión y realizan el diseño/elaboración de sus reportes de gestión mediante hojas Excel. Es así que estos problemas, que no han sido abordados por la empresa, son el punto de partida de nuestra investigación. Por ello, la presente investigación pretende introducir el enfoque de Inteligencia de los Negocios o Business Intelligence y presentar los procesos, las herramientas y las tecnologías que le son propias; mostrar las oportunidades de creación de valor que puede aportar y así darle una utilidad con el ERP – OSIS, de permitir obtener reportes ejecutivos y configurables al usuario en línea con una herramienta web útil para la toma de decisiones a nivel ejecutivo y mejorar la satisfacción de los usuarios al obtener mayor independencia con respecto al área de sistemas y al proveedor. Y con ello ampliar la cartera de clientes, así como también aumentar los beneficios que pueda brindar la venta del producto. 5 1.2. FORMULACION DEL PROBLEMA Problema General Así, ante lo expuesto, se responderá la siguiente pregunta: ¿Es posible que la información registrada por el ERP – OSIS pueda generar reportes dinámicos de situación financiera de una organización mediante el uso de tecnologías y metodologías de Business Intelligence con la implementación de un aplicativo web? Problemas Específicos 1. El crecimiento de los Sistemas de Base de Datos de las organizaciones clientes del ERP-OSIS que en el tiempo se van acumulando, y de cuales los grandes volúmenes de datos requieren ser analizados y cuando la evaluación no es posible se requiere llevar a cabo un análisis confiable. 2. Como en muchos casos a la falta de capacitación del personal, inexistencia de una política corporativa adecuada, la falta de actualización del software, e inversiones inadecuadas. 3. Las empresas clientes fallan en reconocer que los proyectos de BI son iniciativas de negocios interorganizacionales, y en entender dichas iniciativas difieren de las típicas soluciones independientes. 6 Factores Factibilidad Interés Costos Ventaja Competitiva TOTAL Evaluación Calificación 2 3 1 1 3 4 2 PROBLEMAS 2 2 3 2 3 1 2 2 1 6 12 2 PROBLEMAS 2 4 9 2 3 2 6 2 3 5 4 2 15 12 6 14 11 7 35 27 16 Peso Modo de Evaluación de la Decisión a Tomar: Como resultado de la evaluación nos da que el problema Nº 1, es el más importante por abordar y a consecuencia de ello postulamos la pregunta del Problema General. 7 1.3. OBJETIVOS Objetivo General Implementar un Aplicativo Web denominado como Ext Solutions (Aplicativo de Reportes Genéricos), que mediante el uso de Tecnologías y Metodologías de Business Intelligence me permita generar Reportes Dinámicos de la Situación Financiera de una Organización que formará parte de un Sistema de Reportes en Línea, orientado a la gestión de la información registrada por el ERP – OSIS. Objetivos Específicos 1. Identificar los requisitos de los reportes estáticos ya establecidos en ERP – OSIS y evaluar la funcionalidad de creación de Cuadros de Mando que contendrán un conjunto de indicadores de gestión que necesita cada gerente para la toma de decisiones y con un ambiente fácil de usar. 2. Construir una herramienta software que permita la evaluación y control, que asista a las organizaciones en la conducción de una evaluación interna, indicando paso a paso los aspectos del modelo de Inteligencia de Negocios y los aspectos que los proyectos de nuevas tecnologías plantean. 3. Dar al usuario una flexibilidad en la información, estará enfocado para la generación de reportes de Estados Financieros de la organización mediante la generación de Ratios Financieros e Índices de Rentabilidad del negocio, esto generará más detalle de su situación financiera de su organización, y una mejor toma de decisiones de la empresa. 8 Modo de Evaluación de la Decisión a Tomar: Factores Evaluación Calificación 1 3 3 1 2 OBJETIVOS 2 2 4 2 2 3 4 4 3 2 1 9 6 2 2 OBJETIVOS 2 6 8 4 2 3 12 8 6 2 Eficiencia Calidad Tiempo Costo 9 10 13 19 20 28 Peso TOTAL 3 2 2 1 El resultado de la evaluación nos dice que la solución más optima, al problema general, es el objetivo Nº 3. Con el cual se formula el Objetivo General. 9 1.4. JUSTIFICACION DE LA INVESTIGACION Justificación Teórica Business Intelligence es un proceso interactivo para explorar y analizar información estructurada sobre un área (normalmente almacenada en un datawarehouse), para descubrir tendencias o patrones, a partir de los cuales derivar ideas y extraer conclusiones. El proceso de Business Intelligence incluye la comunicación de los descubrimientos y efectuar los cambios. Las áreas incluyen clientes, proveedores, productos, servicios y competidores. Justificación Práctica La presente investigación servirá para constituir una introducción al mundo del Business Intelligence, ofreciendo una visión de conjunto. Los beneficios que se pueden obtener a través del uso de BI pueden ser de distintos tipos: Beneficios tangibles, por ejemplo: Reducción de costes, Generación de ingresos, reducción de tiempos para las distintas actividades del negocio. Beneficios intangibles: el hecho de que se tenga a disposición la información para la toma de decisiones hará que más usuarios utilicen dicha información para tomar decisiones y mejorar la posición competitiva. Beneficios estratégicos: Todos aquellos que facilitan la formulación de la estrategia, es decir, a qué clientes, mercados o con qué productos dirigirnos. 1.5. LIMITACIONES El problema relacionado al sistema ERP-OSIS ya establecido es para generar reportes o se aprovecharían las características del mismo, y el almacenamiento de datos que está alineado directamente con el desarrollo del sistema ERP, que conforme se iban creando los módulos se va extiendo en grandes volúmenes de datos. 10 CAPÍTULO II: MARCO TEÓRICO 2.1. ANTECEDENTES DE LA INVESTIGACION Situación Actual Los usuarios cuentan con módulos integrados al ERP el cual cuenta con una gran variedad de reportes fijos con filtros personalizados los cuales no pueden ser configurados por los usuarios solo por el proveedor del sistema. Facilidad de Uso de Nuevas Tecnologías 1. El aplicativo web se podrá ejecutar desde los principales navegadores con acceso a internet como: Internet Explorer 7.0+, Mozilla Firefox 3, Chrome, Opera, Safari y entre otros que mantengan estándares de codificación HTML 4 y Java script 1.8.1 de ECMAScript. 2. La resolución mínima para la utilización del aplicativo será de 1024x860. 3. Los controles que se utilizaran en las interfaces utilizan Ajax, lo que asegura que los datos no sean actualizados por cada envío o petición al servidor. Seguridad 4. Los datos enviados al servidor son encriptados con el método: code64. 5. La asignación de roles asegura que el usuario, únicamente pueda interactuar con el aplicativo según los roles y permisos asignados por el administrador del aplicativo. 6. La contraseña de acceso al aplicativo utiliza cifrado de “ida” y adicionalmente utiliza una llave privada para la encriptación. 7. Cuando el usuario sea creado con una clave/contraseña/password por defecto, se forzará a un cambio de la misma, al poco tiempo de su creación, para asegurar que sea totalmente privada y personalizada. 8. Cada sesión abierta por un usuario tendrá un máximo de 30 minutos de vida. 9. Pruebas de prevención de SQL-Injection verificadas. Hardware, Software y Red Hardware 10. Servidor de Aplicaciones Jboss 6.0 (Gestión de Lógica de Negocio) – Uso Producción 11. Servidor Web Container Apache Tomcat 6.0 (Gestión de Contenido Dinámico) – Uso Producción 12. Servidor de Base de Datos para PostgreSQL 9.0. 11 Software a ser provistos por SWF-OSIS 13. 14. 15. 16. 17. 18. Servidor de Aplicaciones Jboss 6.0(Software libre) Apache Tomcat 6.0 (Software libre) JDK 6 (Software libre) Jasper Reports (Software Libre) PostgreSQL 9.0 (Software Libre) Sistema Operativo Linux (Software Libre) Requerimientos Específicos de Arquitectura Técnica La conexión entre los clientes y el aplicativo será el siguiente: ● El servidor Web Container Tomcat recepcionará las peticiones GET/POST enviadas por el navegador cliente externo e interno. ● El Web Container Tomcat procesará las peticiones y generará el contenido dinámico, se comunicará con el servidor de aplicaciones para acceder a la información de la empresa, además de la lógica de negocio. Los clientes internos se comunicarán directamente con este servicio. ● El Servidor de Aplicaciones (Jboss) será el encargado de aplicar las reglas y/o lógica del negocio a cada pedido realizado por el WebContainer (además de gestionar el acceso a los datos del ERP-OSIS contenidas en el Servidor de Base de Datos para el aplicativo web) 12 La Arquitectura del Software a Implementar: Se ha optado por utilizar una arquitectura que utilice los estándares internacionales aterrizados en las buenas prácticas para el desarrollo de aplicaciones empresariales, configurando e integrando los siguientes componentes: Capa de Presentación: ● Interfaz de cliente – FrameworkExtJs v 4.0: permite diseñar interfaces de forma rápida y estándar para cualquier navegador. Exonera el tedioso uso de tecnologías como HTML, DHTML, CSS y JavaScript nativo. Esto le agrega rapidez al diseño de interfaces. ● Controlador - Tecnología Jsp y Servlet Java: gestiona las peticiones desde el cliente con el servidor de aplicaciones o negocio. Capa de Negocio: ● Servidor de aplicaciones – Tecnología EJB v 3.0: Es un contenedor de objetos que permite implementar la lógica del negocio, la cual puede ser distribuida en cualquier tipo de cliente. Capa de Integración: ● Acceso a Datos – FrameworkHibernate v 3.2.1: Herramienta que facilita el acceso a datos de forma transparente, encapsulando la complejidad las operaciones para la manipulación de data. Puede conectarse a cualquier motor de Datos sin la necesidad de modificar drásticamente la aplicación. 13 2.2. BASES TEÓRICAS 2.2.1. Business Intelligence Business Intelligence (BI) se refiere principalmente al equipo a base de técnicas utilizadas en la identificación, extracción , y el análisis de los datos de negocio, tales como los ingresos por ventas por los productos y / o departamentos, o por los costos asociados y los ingresos. Tecnologías de BI ofrecen vistas históricas, actuales y predictivo de las operaciones comerciales. Funciones comunes de las tecnologías de inteligencia de negocios están reportando, procesamiento analítico en línea , análisis , minería de datos , proceso de minería , procesamiento de eventos complejos , gestión del rendimiento empresarial , la evaluación comparativa , de minería de texto y el análisis predictivo . La inteligencia de negocios tiene como objetivo apoyar una mejor toma de decisiones empresariales. Así, un sistema de BI puede ser llamado un sistema de apoyo a las decisiones (DSS).A pesar de la inteligencia empresarial a largo plazo a veces se usa como sinónimo de inteligencia competitiva , ya que tanto la decisión de apoyo de decisiones, BI utiliza las tecnologías, procesos y aplicaciones para analizar sobre todo los datos internos, estructurados y procesos de negocio, mientras que la inteligencia competitiva recoge, analiza y difunde información con un enfoque de actualidad sobre los competidores de la empresa. La inteligencia de negocios entenderse en sentido amplio puede incluir el subconjunto de la inteligencia competitiva. Historia En un artículo de 1958, IBM investigador Hans Peter Luhn utiliza la inteligencia de negocio a largo plazo. Él definió la inteligencia como: "la capacidad de aprehender las interrelaciones de los hechos presentados en tal forma que para orientar la acción hacia una meta deseada". La inteligencia de negocios tal como se entiende hoy en día se dice que han evolucionado desde los sistemas de apoyo a las decisiones que se inició en la década de 1960 y desarrollado a lo largo de mediados de la década de 1980. DSS se originó en los modelos asistidos por ordenador creados para ayudar en la toma de decisiones y la planificación. Desde el DSS, los almacenes de datos , los sistemas de información ejecutivos y OLAP e inteligencia de negocios llegó a principios de enfoque en los años 80. En 1989, Howard Dresner (más tarde, un grupo de Gartner analista) propuso la "inteligencia de negocios" como un término general para describir "los conceptos y métodos para mejorar la toma de decisiones empresariales mediante el uso de sistemas basados en hechos de apoyo". No fue hasta finales de década de 1990 que este uso estaba muy extendido. 14 La Inteligencia de Negocios y Almacenamiento de Datos A menudo, las aplicaciones de BI utilizar los datos reunidos a partir de un almacén de datos o data mart . Sin embargo, no todos los almacenes de datos se utilizan para inteligencia de negocios, ni todas las aplicaciones de inteligencia de negocios requieren de un almacén de datos. Con el fin de distinguir entre los conceptos de inteligencia y de negocios almacenes de datos, de Forrester Research, a menudo define la inteligencia empresarial en una de dos maneras: Utilizando una definición amplia: "Business Intelligence es un conjunto de metodologías, procesos, arquitecturas y tecnologías que transforman los datos brutos en información significativa y útil que se usa para habilitar puntos de vista más eficaz estratégico, táctico y operativo y la toma de decisiones". Cuando se utiliza esta definición, la inteligencia empresarial también incluye tecnologías como la integración de datos, calidad de los datos, almacenamiento de datos, gestión de datos maestros, textos y análisis de contenido, y muchos otros que el mercado a veces protuberancias en la gestión de la información del segmento. Por lo tanto, Forrester se refiere a la preparación de datos y uso de datos en dos segmentos separados, pero estrechamente vinculados: la pila de inteligencia de negocios de la arquitectura. Forrester define el mercado de esta última, más estrecha de inteligencia de negocios como "sólo se refiere a las capas superiores de la pila de BI, tales como la arquitectura de información, análisis y cuadros de mando ". Inteligencia de Negocios y de Análisis de Negocios Thomas Davenport ha argumentado que la inteligencia de negocio se debe dividir en consultas , informes , OLAP , una herramienta de "alertas", y el análisis de negocios . En esta definición, análisis de negocios es el subconjunto de BI basadas en las estadísticas, la predicción y optimización. Aplicaciones en una Empresa La inteligencia de negocios se puede aplicar a los siguientes fines comerciales (MARCKM), con el fin de impulsar el valor empresarial. 1. Medición - programa que crea una jerarquía de indicadores de desempeño (véase también el modelo de métricas de referencia ) y puntos de referencia que informa a los líderes empresariales acerca del progreso hacia los objetivos de negocio ( Business Process Management ). 2. Google Analytics - programa que establece los procesos cuantitativos para un negocio para llegar a decisiones óptimas y para realizar el descubrimiento de conocimiento del negocio. Con frecuencia se refiere a: la minería de datos , minería de procesos , análisis estadístico , análisis predictivo , modelos de predicción , el modelado de procesos de negocios , procesamiento de eventos complejos . 15 3. Informes / empresa que presenta - programa que construye la infraestructura para la información estratégica para servir a la gestión estratégica de un negocio, no informes de operaciones. Con frecuencia implica la visualización de datos , sistema de información ejecutiva y OLAP . 4. Colaboración / plataforma de colaboración - programa que recibe las diferentes áreas (tanto dentro como fuera de la empresa) para trabajar juntos a través de intercambio de datos y el intercambio electrónico de datos . 5. La gestión del conocimiento - programa para hacer que los datos de la empresa impulsada a través de estrategias y prácticas para identificar, crear, representar, distribuir y permitir la adopción de ideas y experiencias que son el conocimiento del negocio verdadero. La gestión del conocimiento conduce a la gestión del aprendizaje y el cumplimiento de las normativas / cumplimiento . Además de lo anterior, inteligencia de negocios también puede proporcionar un enfoque pro-activo, tales como la función de alarma para alertar de inmediato a los usuarios finales. Hay muchos tipos de alertas, por ejemplo, si algún valor comercial supera el valor límite el color de esa cantidad en el informe se vuelve rojo y el analista de negocios se alertó. A veces un mail será enviado al usuario también. Este extremo a otro proceso requiere la gobernabilidad de datos, que debe ser manejado por el experto. La Priorización de Proyectos de Business Intelligence A menudo es difícil establecer un modelo de negocios positivo para las iniciativas de inteligencia de negocios y, a menudo los proyectos deben ser priorizados a través de iniciativas estratégicas. Éstos son algunos consejos para aumentar los beneficios de un proyecto de BI. Según lo descrito por Kimball debe determinar los beneficios tangibles tales como el costo de eliminar la producción de informes existentes. Exigir el acceso a los datos para toda la organización. De esta manera, incluso un pequeño beneficio, como por ejemplo unos minutos guardados, hará una diferencia en lo que se multiplica por el número de empleados en toda la organización. Según lo descrito por Ross, Weil y Roberson de la Empresa Arquitectura, considere dejar que el proyecto de BI ser impulsada por otras iniciativas empresariales con casos de negocio excelentes. Para apoyar este enfoque, la organización debe tener Enterprise Architects, que será capaz de detectar los proyectos de negocio apropiados. Los Factores de Éxito de la Aplicación Antes de implementar una solución de BI, vale la pena tomar en cuenta diversos factores antes de proceder.Según Kimball y otros, estas son las tres áreas críticas que necesitan para evaluar dentro de su organización antes de prepararse para hacer un proyecto de BI: 1. El nivel de compromiso y el patrocinio del proyecto de la alta dirección 2. El nivel de necesidad de negocio para crear una implementación de BI 3. La cantidad y calidad de los datos comerciales disponibles. 16 El Patrocinio de Empresas El compromiso y el patrocinio de la alta dirección es de acuerdo a Kimball et al., Los criterios más importantes para la evaluación. Esto se debe contar con el respaldo de gestión fuerte ayudará a superar las deficiencias en el resto del proyecto. Pero como Kimball et al estado: ". Hasta el más elegante diseño DW / sistema de BI no pueden superar la falta de negocio [la gerencia] patrocinio". Es muy importante que el personal de administración que participan en el proyecto de tener una visión y una idea de las ventajas e inconvenientes de la implementación de un sistema de BI. El patrocinador del mejor negocio debe tener influencia la organización y deben estar bien conectados dentro de la organización. Lo ideal es que el patrocinador del negocio es exigente, pero también es capaz de ser realista y de apoyo si la aplicación se ejecuta en los retrasos o inconvenientes. El patrocinador de gestión también debe ser capaz de asumir la responsabilidad y asumir la responsabilidad de los fracasos y retrocesos en el proyecto. Es imperativo que no haya apoyo de varios miembros de la dirección por lo que el proyecto no se producirá un error si una persona deja el grupo de dirección. Sin embargo, tener muchos gerentes que trabajan juntos en el proyecto también puede significar que el que hay varios intereses diferentes que tratan de sacar adelante el proyecto en diferentes direcciones. Por ejemplo, si los diferentes departamentos quieren poner más énfasis en su uso de la aplicación. Este problema puede ser contrarrestado por un análisis inicial y específico de las diferentes áreas de negocio que más se benefician de la aplicación. Todas las partes interesadas en el proyecto deben participar en este análisis con el fin de que ellos se sientan dueños del proyecto y encontrar un terreno común entre ellos. Otro de los problemas de gestión que deben ser encontradas antes del inicio de la aplicación es si el patrocinador de negocios es demasiado agresivo. Si el individuo de gestión se deja llevar por las posibilidades de utilizar BI y empieza a querer a la aplicación de DW o BI para incluir varios conjuntos de datos que no fueron incluidos en la fase de planificación inicial. Sin embargo, dado que las implementaciones adicionales de datos adicionales más probable es que agregue muchos meses con el plan original. Es probablemente una buena idea para asegurarse de que la persona de la gerencia es consciente de sus actos. La Aplicación debe ser Impulsada por las Necesidades del Negocio Claros Debido a la estrecha relación con la alta dirección, otra cosa importante que debe ser evaluada antes de que el proyecto se ejecuta es la de si existe o no es realmente una necesidad de negocio y si hay un beneficio comercial claro al hacer la puesta en práctica. Las necesidades y los beneficios de la puesta en práctica a veces impulsado por la competencia y la necesidad de obtener una ventaja en el mercado. Otra de las razones para un enfoque de negocio orientado a la aplicación de BI es la adquisición de otras organizaciones que ampliar la organización original que a veces puede ser beneficioso para poner en práctica DW o BI para crear una mayor supervisión. 17 La Cantidad y la Calidad de los Datos Disponibles Este debe ser el factor más importante, ya que sin buenos datos - que en realidad no importa cuán bueno sea su patrocinio de la gestión o la motivación orientada a los negocios es. Si usted no tiene los datos, o los datos no tiene la calidad suficiente, cualquier implementación de BI se producirá un error. Antes de la ejecución es una muy buena idea para hacer perfiles de datos, este análisis será capaz de describir el "contenido, la coherencia y la estructura de [..]" de los datos. Esto debe hacerse lo más temprano posible en el proceso y si el análisis muestra que los datos que falta, es una buena idea poner el proyecto en el estante de forma temporal, mientras que el departamento de TI se da cuenta de cómo hacer la recogida de datos adecuada. Aspecto Usuario Algunas consideraciones deben hacerse con el fin de integrar con éxito el uso de sistemas de inteligencia de negocios en una empresa. En última instancia el sistema de BI debe ser aceptado y utilizado por los usuarios en orden para que se agregue valor a la organización. Si la usabilidad del sistema es deficiente, los usuarios pueden sentirse frustrados y pasar una cantidad considerable de tiempo encontrar la manera de utilizar el sistema o puede no ser capaz de utilizar realmente el sistema. Si el sistema no agrega valor a la misión de los usuarios, no sólo tiene que utilizar. Con el fin de aumentar la aceptación de los usuarios de un sistema de BI, puede ser aconsejable consultar a los usuarios de negocios en una etapa temprana del ciclo de vida del DW / BI, por ejemplo, los requisitos de recolección de fase. Esto puede proporcionar una idea de la de procesos de negocio y lo que necesitan los usuarios del sistema de BI. Hay varios métodos para la recopilación de esta información, como cuestionarios y sesiones de entrevistas. Al reunir los requisitos de los usuarios de negocios, el. Local, el departamento de TI también deben ser consultados con el fin de determinar en qué medida es posible cumplir con las necesidades del negocio sobre la base de los datos disponibles Asumir un enfoque centrado en el usuario durante la etapa de diseño y desarrollo puede aumentar aún más la posibilidad de la adopción del usuario rápida del sistema de BI. Además de centrarse en la experiencia de usuario que ofrecen las aplicaciones de BI, sino que también puede posible para motivar a los usuarios utilizar el sistema mediante la adición de un elemento de competencia. Kimball sugiere la aplicación de una función en el portal de negocios de inteligencia sitio web donde los informes sobre el uso del sistema se puede encontrar. De este modo, los administradores pueden ver lo bien que están haciendo sus departamentos y compararse con los demás y esto puede estimular a animar a su personal para utilizar el sistema de BI más. En un artículo de 2007, HJ Watson da un ejemplo de cómo el elemento competitivo puede actuar como un incentivo. Watson describe como un gran centro de llamadas 18 ha puesto en marcha paneles de rendimiento para todos los agentes de llamadas y que los incentivos de bonos mensuales se han atado a las métricas de rendimiento. Además, los agentes pueden ver cómo su propio desempeño se compara con los otros miembros del equipo. La implementación de este tipo de medición del desempeño y la competencia mejoró significativamente el desempeño de los agentes. Otros elementos que pueden aumentar el éxito de BI puede ser mediante la participación de la alta dirección con el fin de BI una parte de la cultura de la organización y también por proporcionar a los usuarios con las herramientas necesarias, capacitación y apoyo. Al ofrecer la formación de usuarios, más la gente realmente puede utilizar la aplicación de BI. Proporcionar apoyo a los usuarios es necesario para mantener el sistema de inteligencia de negocios y ayudar a los usuarios que se encuentran con problemas. Para asistir al usuario puede ser incorporado en muchos aspectos, por ejemplo mediante la creación de un sitio web. El sitio web debe contener un gran contenido y las herramientas para encontrar la información necesaria. Además, el apoyo helpdesk puede ser utilizado. El servicio de asistencia pueden ser manejadas por los usuarios de energía por ejemplo, o el equipo del proyecto DW / BI. Mercado Hay una serie de proveedores de inteligencia de negocios, a menudo clasifican en los restantes independientes "pure-play", los vendedores y los consolidados "megavendors", que han entrado en el mercado a través de una tendencia reciente de las adquisiciones en la industria de BI. Algunas empresas que adoptan el software de BI decide escoger y elegir entre diferentes ofertas de productos (en el mejor de su clase) en vez de comprar una solución integrada completa (servicio completo). Específicas de la Industria Consideraciones específicas para los sistemas de inteligencia de negocios tienen que ser tomadas en algunos sectores tales como las regulaciones bancarias gubernamentales . La información recopilada por las instituciones bancarias y analizados con el software de BI deben ser protegidos de algunos grupos o individuos, con la plena disposición de otros grupos o individuos. Por lo tanto las soluciones de BI deben ser sensibles a las necesidades y ser lo suficientemente flexible como para adaptarse a las nuevas regulaciones y cambios en las leyes vigentes. 19 LosDatos Semi-estructurados y no Estructurados Las empresas crean una gran cantidad de información valiosa en forma de e-mails, notas, notas de los centros de llamadas, noticias, grupos de usuarios, charlas, informes, páginas web, presentaciones, archivos de imágenes, archivos de vídeo, y material de marketing y noticias. Según Merrill Lynch, más del 85% de toda la información de negocios que existe en estas formas. Este tipo de información que se denominan de datos semi-estructurados y no estructurados. Sin embargo, las organizaciones suelen utilizar estos documentos sólo una vez. La gestión de los datos semi-estructurados se reconoce como un problema importante sin resolver en la industria de tecnología de la información.Según las proyecciones de Gartner (2003), trabajadores de cuello blanco pasará de 30 a 40 por ciento de su tiempo buscando, encontrando y la evaluación de los datos no estructurados. BI utiliza tanto los datos estructurados y no estructurados, pero el primero es fácil de buscar, y el segundo contiene una gran cantidad de la información necesaria para el análisis y la toma de decisiones. Debido a la dificultad de manera adecuada buscar, encontrar y evaluar los datos no estructurados o semi-estructurada, las organizaciones no pueden recurrir a estas vastas reservas de información, lo que podría influir en una decisión particular, tarea o proyecto. En última instancia, puede conducir a la toma de decisiones mal informado. Por lo tanto, en el diseño de una inteligencia de negocios / DW-solución de los problemas específicos asociados con los datos semi-estructurados y no estructurados deben acomodarse a, así como los correspondientes a los datos estructurados. Los Datos no Estructurados Frente a los Datos Semi-estructurados Los datos no estructurados y semi-estructurados tener diferentes significados según el contexto. En el contexto de los sistemas de bases de datos relacionales, se refiere a datos que no pueden ser almacenados en columnas y filas . Debe ser almacenado en un BLOB (objeto binario grande), un cajón de sastre tipo de datos disponibles en la mayoría de bases de datos relacionales sistemas de gestión. Pero muchos de estos tipos de datos, como mensajes de correo electrónico, archivos de texto, procesadores de texto, imagen PPTs de archivos y archivos de vídeo de ajustarse a un estándar que ofrece la posibilidad de metadatos. Los metadatos pueden incluir información como el autor y el momento de la creación, y esto puede ser almacenada en una base de datos relacional. Por lo tanto, puede ser más exacto hablar de esto como semi-estructuradas, documentos o datos , pero no hay consenso específica parece haber sido alcanzado. 20 Problemas con los Datos Semi-estructurados y no Estructurados Hay varios retos para el desarrollo de BI con datos semi-estructurados. De acuerdo con Inmon y Nesavich, algunos de ellos son: 1. Físicamente el acceso a datos no estructurados - textuales de datos no estructurados se almacena en una gran variedad de formatos. 2. Terminología - Entre los investigadores y analistas, hay una necesidad de desarrollar una terminología normalizada. 3. El volumen de datos - Como se dijo anteriormente, hasta el 85% de todos los datos existen como datos semi-estructurados. A esto le añadimos la necesidad de una palabra a palabra y el análisis semántico. 4. De búsqueda de datos no estructurados textuales - Una simple búsqueda en algunos datos, por ejemplo, manzana, da lugar a enlaces donde hay una referencia a ese término de búsqueda preciso. (Inmon y Nesavich, 2008) da un ejemplo: "se realiza una búsqueda en el delito de plazo. En una búsqueda simple, el delito se utiliza el término, y en todas partes hay una referencia a delito grave, un golpe a un documento estructurado que se haga. Sin embargo, una simple búsqueda es crudo. No encontramos referencias a la delincuencia, incendios, asesinatos, malversación de fondos, homicidio vehicular, y tal, a pesar de que estos crímenes son los tipos de delitos. " El Uso de Metadatos Para solucionar problemas con la búsqueda y la evaluación de los datos, es necesario saber algo sobre el contenido. Esto puede hacerse mediante la adición de contexto a través de la utilización de metadatos. Muchos de los sistemas ya registran algunos de los metadatos (por ejemplo, nombre, autor, tamaño, etc), pero más útil sería metadatos sobre el contenido real - por ejemplo, resúmenes, temas, personas o empresas mencionadas. Dos tecnologías diseñadas para la generación de metadatos sobre el contenido son categorización automática, y la extracción de la información. Futuro Un documento de 2009 de Gartner predijo estos desarrollos en el mercado de Business Intelligence: Debido a la falta de información, procesos y herramientas, hasta el año 2012, más del 35 por ciento de las 5.000 principales empresas mundiales con regularidad dejará de tomar decisiones sobre los empleados de cambios significativos en sus negocios y mercados. En 2012, las unidades de negocio controlarán al menos el 40 por ciento del presupuesto total de inteligencia de negocios. En 2012, un tercio de las aplicaciones analíticas aplicadas a los procesos de negocio serán entregados a través de grano grueso de la aplicación mashup . Un informe especial de la Información 2009 de Gestión predijo las tendencias principales de BI: " informática verde , las redes sociales , visualización de datos , BI 21 móvil , el análisis predictivo , las aplicaciones compuestas , el cloud computing y el multitouch ". Otras tendencias de inteligencia de negocios incluyen los siguientes: Terceros en SOA de BI productos cada vez más abordar las cuestiones de ETL de volumen y rendimiento. La computación en nube y software-as-a-Service (SaaS) están en todas partes. Empresas abrazan en memoria de procesamiento, el procesamiento de 64 bits, y preempaquetados aplicaciones de BI de análisis. Las aplicaciones operativas que se puede llamar los componentes de BI, con mejoras en el tiempo de respuesta, la escala y la concurrencia. Cerca o en tiempo real de análisis de BI es una expectativa básica. Abra el software de BI de origen sustituye a las ofertas de los proveedores. Otras líneas de investigación incluyen el estudio combinado de inteligencia de negocios y datos inciertos. En este contexto, los datos utilizados no se supone que es precisa, exacta y completa. En cambio, los datos se considera incierto y por lo tanto, esta incertidumbre se propaga a los resultados obtenidos por BI. Según un estudio realizado por Aberdeen Group, ha habido un creciente interés en el Software-as-a-Service Business Intelligence (SaaS) en los últimos años, con el doble de las organizaciones que utilizan este enfoque de implementación que hace un año 15% en 2009 frente al 7% en 2008. Un artículo de Chris InfoWorld puntos Kanaracus a los datos de crecimiento similares de la firma de investigación IDC, que predice que el mercado de BI SaaS crecerá un 22 por ciento cada año hasta el 2013, gracias a la sofisticación del producto aumentó, tensa los presupuestos de TI, y otros factores. 2.2.2. Algunos ejemplos prácticos de implementaciones reales de Business Intelligence. La duda de quiénes son los clientes rentables y cuáles los problemáticos para las compañías aseguradoras por fin fue resuelta: el grupo de población delsexo femenino cuya edad oscila entre los 25 y 39 años es el que registra menos reclamos por seguros de automóvil; en tanto los hombres de entre 18 y 25 años son una verdadera amenaza porque es justamente en este grupo de población en donde se reporta el mayor número de accidentes automovilísticos. . No fue un grupo de investigadores entrenados ex-profeso quien encontró la respuesta. Simplemente se utilizó la técnica de Data Mining (Minería de datos) en el Data Warehouse global de la empresa el cual está integrado, a su vez, con un sistema de soporte para la decisión. Solución: la compañía aseguradora en cuestión determinó diseñar un plan especial de aseguramiento con estímulos y descuentos atractivos para retener a sus clientes rentables, es decir, las mujeres de entre 25 y 29 años de edad, se 22 decidió además la creación de productos específicos para estimular el ingreso de nuevas clientes con estas características. En cambio, para los clientes de riesgo, los jóvenes de 18 a 25 años, la empresa aseguradora decidió aumentar sensiblemente el costo del seguro. Una decisión de negocios basada en el uso de la tecnología. Más allá de las definiciones formales, el ejemplo descrito resume la aplicación en un caso concreto de la Inteligencia de Negocios, tema obligado en el ámbito de la integración de soluciones informáticas y factor de cambio en la manera de concebir la aplicación de la tecnología a nivel empresarial. (Cano, 1999). Twentieth Century Fox usa Business Intelligence para filtrar millones de recipientes de zonas postales y predecir que actores, argumentos y filmes serán populares en cada vecindario. Evitando ciertos argumentos en cines específicos, la compañía tiene ahorros de aproximadamente $100 Millones de dólares alrededor del mundo cada año. La misma tecnología puede seleccionar "traliers" (cortos previos a la presentación de una película) alternativos por cada película en cada cine para ayudar así a maximizar las ventas. Una película puede tener diferentes "trailers", cada cual puede percibirse de diferente forma por diversos tipos de audiencias (Martín, 2001). Los sistemas Business Intelligence de Jhon Deere no predicen el futuro, sino que lo planifican. Esta empresa manufacturera de equipos para agricultura, mejoran su negocio dando a los clientes una gran diversidad de opciones en los productos que ellos pueden requerir, resultando en millones de permutaciones para cada opción. Esto es grandioso para el área de marketing pero es un verdadero dolor de cabeza para el área de manufactura. Deere encontró la solución empleando inteligencia computarizada que aprende a "criar" agendas mucho mejor de lo que lo harían los seres humanos. El equipo de agricultura ahora fluye mucho mas suavemente a través de la línea de producción, con meses de anticipación (Martín, 2001). Así como éstos, existen una gran variedad de casos de aplicación exitosa a gran escala de éste tipo de sistemas, que han conferido una verdadera inteligencia al negocio, proporcionándole no solo una marcada eficiencia, sino que eventualmente puede marcar la diferencia entre la supervivencia o desaparición de una empresa. 2.2.3. La Inteligencia del Negocio en cualquier lugar y en cualquier momento. Actualmente el acceso a la información clave del negocio en cualquier lugar y en cualquier momento, se está convirtiendo en la mayor prioridad para muchos negocios. Es por ello que los proveedores de Business Intelligence, cuyos productos analizan una gran cantidad de datos de ventas, clientes,personal, entre muchos otros, están añadiendo la capacidad wireless (transmisión inalámbrica) a su software (Williams, 2000). Existen varios proveedores de éste tipo de tecnologías, entre los mas destacados podemos mencionar a Information Builders Inc., quien lanzó "Tell Me by E-mail", el cual da acceso a los clientes a la información por medio de celulares, Pda’s y otros 23 dispositivos inalámbricos. Hummingbird Ltd. liberó "Business Intelligence Suite 7.0" que permite exportar la información a dispositivos Palm VII. Existen otras empresas que se están moviendo hacia este nuevo mercado de información telemática, como MicroStrategy, Cognos, Informática, Oracle, entre otros. . Otro proveedor importante de este tipo de soluciones es Business Objects, que ofrece "Web Intelligence Wireless Edition" que proporcionan consultar reportes y análisis por medios wireless usando cualquier dispositivo compatible con wap (wireless access protocol) (http://www.businessobjects.com). El beneficio de ésta solución, según afirman los ejecutivos de Business Objects, será la habilidad de recibir e interactuar con el Business Intelligence de la organización en tiempo real, lo cual es invaluable para la nueva generación de ejecutivos móviles. (Latting, 2000) Otro competidor tradicional en el mercado es Informix, el cual ofrece "Visionary 2.0" el cual es una solución un tanto diferente, ya que está diseñado para acoplarse con cualquier solución compatible con el estándar ODBC, para proporcionar a la información análisis visualmente muy ricos. 2.2.3 Sistemas de Soporte a la Decisión (DSS) Un Sistema de Soporte a la Decisión (DSS) es una herramienta de Business Intelligence enfocada al análisis de los datos de una organización. En principio, puede parecer que el análisis de datos es un proceso sencillo, y fácil de conseguir mediante una aplicación hecha a medida o un ERP sofisticado. Sin embargo, no es así: estas aplicaciones suelen disponer de una serie de informes predefinidos en los que presentan la información de manera estática, pero no permiten profundizar en los datos, navegar entre ellos, manejarlos desde distintas perspectivas... etc. 24 El DSS es una de las herramientas más emblemáticas del Business Intelligence ya que, entre otras propiedades, permiten resolver gran parte de las limitaciones de los programas de gestión. Estas son algunas de sus características principales: Informes dinámicos, flexibles e interactivos, de manera que el usuario no tenga que ceñirse a los listados predefinidos que se configuraron en el momento de la implantación, y que no siempre responden a sus dudas reales. No requiere conocimientos técnicos. Un usuario no técnico puede crear nuevos gráficos e informes y navegar entre ellos, haciendo drag&drop o drill through. Por tanto, para examinar la información disponible o crear nuevas métricas no es imprescindible buscar auxilio en el departamento de informática. Rapidez en el tiempo de respuesta, ya que la base de datos subyacente suele ser un datawarehouse corporativo o un datamart, con modelos de datos en estrella o copo de nieve. Este tipo de bases de datos están optimizadas para el análisis de grandes volúmenes de información. Integración entre todos los sistemas/departamentos de la compañía. El proceso de ETL previo a la implantación de un Sistema de Soporte a la Decisión garantiza la calidad y la integración de los datos entre las diferentes unidades de la empresa. Existe lo que se llama: integridad referencial absoluta. Cada usuario dispone de información adecuada a su perfil. No se trata de que todo el mundo tenga acceso a toda la información, sino de que tenga acceso a la información que necesita para que su trabajo sea lo más eficiente posible. Disponibilidad de información histórica. En estos sistemas está a la orden del día comparar los datos actuales con información de otros períodos históricos de la compañía, con el fin de analizar tendencias, fijar la evolución de parámetros de negocio... etc. Diferencia con otras Herramientas de Business Intelligence El principal objetivo de los Sistemas de Soporte a Decisiones es, a diferencia de otras herramientas como los Cuadros de Mando (CMI) o los Sistemas de Información Ejecutiva (EIS), explotar al máximo la información residente en una base de datos corporativa (datawarehouse o datamart), mostrando informes muy dinámicos y con gran potencial de navegación, pero siempre con una interfaz gráfica amigable, vistosa y sencilla. 25 Otra diferencia fundamental radica en los usuarios a los que están destinadas las plataformas DSS: cualquier nivel gerencial dentro de una organización, tanto para situaciones estructuradas como no estructuradas. (En este sentido, por ejemplo, los CMI están más orientados a la alta dirección). Por último, destacar que los DSS suelen requerir (aunque no es imprescindible) un motor OLAP subyacente, que facilite el análisis casi ilimitado de los datos para hallar las causas raíces de los problemas/pormenores de la compañía. Sistemas de Información Ejecutiva (EIS). Los sistemas de información ejecutiva (EIS, Executive Information System) son el tipo de DSS que más se suele emplear en Business Intelligence, ya que proveen a los gerentes de un acceso sencillo a información interna y externa de su compañía, y que es relevante para sus factores clave de éxito. 2.2.4 DATA WAREHOUSE La ventaja principal de este tipo de sistemas se basa en su concepto fundamental, la estructura de la información. Este concepto significa el almacenamiento de información homogénea y fiable, en una estructura basada en la consulta y el tratamiento jerarquizado de la misma, y en un entorno diferenciado de los sistemas operacionales. Se caracteriza por ser: Integrado: Los datos almacenados en el Data Warehouse deben integrarse en una estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. La información suele estructurarse también en distintos niveles de detalle para adecuarse a las distintas necesidades de los usuarios. Temático: Sólo los datos necesarios para el proceso de generación del conocimiento del negocio se integran desde el entorno operacional. Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser consolidados en una única tabla del 26 Data Warehouse. De esta forma, las peticiones de información sobre clientes serán más fáciles de responder dado que toda la información reside en el mismo lugar. Histórico: El tiempo es parte implícita de la información contenida en un Data Warehouse. En los sistemas operacionales, los datos siempre reflejan el estado de la actividad del negocio en el momento presente. Por el contrario, la información almacenada en el Data Warehouse sirve, entre otras cosas, para realizar análisis de tendencias. Por lo tanto, el Data Warehouse se carga con los distintos valores que toma una variable en el tiempo para permitir comparaciones. 2.2.5 WEBHOUSING La popularización de Internet y la tecnología Web, ha creado un nuevo esquema de información en el cual los clientes tienen a su disposición unas cantidades ingentes de información. La integración de las tecnologías Internet y Data Warehouse tienen una serie de ventajas como son: Consistencia: Toda la organización accede al mismo conjunto de datos y ve los informes que reflejan sus necesidades. Hay una "única versión de la verdad". Accesibilidad: La empresa acede a la información a través de un camino común (elbrowserde Internet), simplificando el proceso de búsqueda de la información. Disponibilidad: La información es accesible en todo momento, independientemente de los sistemas operacionales. Bajos costes de desarrollo y mantenimiento, debidos a la estandarización de las aplicaciones de consultas basadas en Internet, independientemente del sistema operativo que soporte el browser, y de la reducción de los costes de distribución de software en los puestos clientes. Protección de los datos, debido al uso de tecnologías consolidadas de protección en entornos de red (firewalls). Bajos costes de formación, debido al uso de interfaces tipo Web. 27 La interactividad de las aplicaciones en este entorno pueden tener varios niveles: Publicación de Datos: Las páginas distribuyen información obtenida del Data Warehouse, volcada en las páginas intra/internet. Distribución de reportes: dando soporte a consultas simples elaboradas por los usuarios. Aplicaciones Dinámicas: Sirviendo de soporte de decisión a servicios solicitados desde el puesto cliente, ejecutando la petición en el servidor y devolviéndolas al cliente, vía el browser de Internet o haciendo uso de "applets" de Java. 28 2.2.6 Sistemas OLAP La tecnología OLAP, es en esencia una revisión del enfoque que tradicionalmente se ha aplicado al desarrollo de los sistemas de apoyo a la toma de decisiones y de análisis del negocio. La concentración en la atención de los sistemas de información en las operaciones de la empresa, dio lugar a sistemas especializados en el tratamiento eficiente y seguro de altos volúmenes de transacciones cortas (facturación, movimientos de inventarios, etc.). Esto es conocido como OLTP (On-Line Transaction Processing). Pero dentro de la óptica de los sistemas dirigidos a OLTP, el soporte de las actividades de análisis jugó un papel secundario, generalmente caracterizado por métodos de trabajo que acceden en forma directa a la “base de datos” (la misma que está soportando las operaciones on-line) con la finalidad de extraer y procesar la información Este enfoque tiene tres consecuencias negativas sobre los resultados obtenidos: • Se recarga el ambiente que sostiene las aplicaciones de misión crítica de la empresa. • Se va en contra de los mecanismos de optimización de las “bases de datos”, especialmente previstos para el trabajo transaccional. • No se han desarrollado herramientas efectivas y específicas para la función de análisis. Si bien han surgido varias propuestas aisladas, las limitaciones presentadas por las mismas (en gran medida como consecuencia de los dos puntos anteriores), no han permitido su difusión y aplicación práctica. Lo más importante de la propuesta OLAP es que parte de un redimensionamiento de la importancia del análisis de la información y plantea un conjunto de técnicas y sistemas que rompen con la subordinación de esta área al de las operaciones. Esa ruptura se expresa en los siguientes elementos que la caracterizan: • • • • Un nuevo Modelo de Datos Desarrollo de Técnicas para el Análisis de Datos Extremadamente bajos tiempos de respuesta Alta accesibilidad a la información por parte de personas, sitios y medio 29 2.2.6.1. Introducción La información nos permite reducir la incertidumbre (sobre algún aspecto en particular) permitiéndonos tomar mejores decisiones. En un principio los sistemas de información tenían como objetivo recopilar información sobre una porción del mundo para ayudar en la toma de decisiones. Actualmente con el advenimiento de la informatización de las organizaciones y además la aparición de softwares operacionales su finalidad pasó a ser la de dar soporte a los procesos básicos de la organización: ventas, productos, personal, etc. Primero se busca satisfacer la necesidad de tener un soporte informático para los procesos básicos de la organización como son, los sistemas de información para la gestión. Luego las organizaciones terminan exigiendo nuevas prestaciones para los sistemas de información, como son los sistemas de información para la toma de decisiones. En la actualidad han aparecido herramientas de negocio o DSS que coexisten: EIS, OLAP, Minería de Datos, etc. Lo cual nos plantea una serie de interrogantes como son: Diferencias entre un EIS y OLAP Los EIS son sistemas de información junto con un conjunto de herramientas asociadas que permiten: Acceso a los directivos a la información de estado y sus actividades de gestión. Especializado en análisis del estado diario de la organización (mediante indicadores claves) para informar rápidamente sobre cambios a los directivos. La información solicitada por lo general suele ser de naturaleza numérica (ventas semanales, niveles de stock, balances, etc.) con una representación gráfica al estilo de una hoja de cálculo. En cambio las herramientas OLAP son genéricas: Funcionan sobre un sistema de información como almacenes de datos. Permiten realizar agregaciones y combinaciones de los datos de diversas maneras, con el objetivo de realizar análisis más estratégicos de datos. 30 Diferencia entre Informes Avanzados Y OLAP Los sistemas de informes avanzados se caracterizan por lo siguiente: Están basados generalmente en sistemas relacionales u objetos relacionales. Utilizan operadores clásicos, como son concatenación, proyección, selección, etc. (tanto en SQL como en extensiones). El resultado es presentado de manera tabular. En cambio las herramientas OLAP: No sólo utilizan los operadores clásicos sino que además utilizan operadores específicos como por ejemplo Drill, Roll, Pivot, Slice & Dice, entre otros. El resultado es expresado en manera matricial o híbrida. Diferencia Esencial entre OLAP y Data Mining Como, ciertas cosas en las bases de datos son verdaderas, el usuario plantea una hipótesis (patrón hipotético) y la verifica con una herramienta OLAP. Surgen problemas cuando crece el número de variables. Mientras que el Data Mining usa los datos para describir patrones. Encuentra patrones en los cuales el usuario no había pensado. Relación existente entre estas herramientas Algunas de estas herramientas han hecho cambiar la manera de trabajar de otras. La manera en que trabajan cada una de ellas es la siguiente: Censar el ambiente: OLTP. Recordar lo censado: Data Warehouse y Data Marts. Razonar: OLAP Aprender: Data Mining, KDD. Otros tipos Los siguientes acrónimos a veces también se utilizan, aunque no son sistemas tan generalizados como los anteriores: WOLAP o Web OLAP: OLAP basado u orientado para la web. DOLAP o Desktop OLAP: OLAP de escritorio RTOLAP o Real Time OLAP: OLAP en tiempo real SOLAP o Spatial OLAP: OLAP espacial 31 2.2.6.2. Operadores OLAP Estas herramientas permiten al usuario obtener una visión multidimensional de los datos, para cada actividad que es objeto de análisis. Con este tipo de herramientas el usuario le formula consultas seleccionando atributos de esta visión o esquema multidimensional sin tener, este, conocimiento de la estructura interna del almacén de datos. La herramienta OLAP genera la consulta y la envía al gestor de consultas del sistema, por ejemplo esto podría hacerse por medio de una sentencia SELECT. Una consulta a un almacén de datos consiste básicamente en la obtención de medidas sobre los hechos parametrizadas sobre las dimensiones. Un ejemplo típico es el caso de un supermercado, supongamos que se quisiera saber cuál es el importe de las ventas durante el año 2002 de los productos del departamento bebidas, por trimestre y por categoría. En este caso: La medida sería: importe. El hecho: ventas. Las restricciones: producto del departamento bebidas, ventas durante el año 2002. El parámetro de la consulta: por categoría de producto y por trimestre. Lo interesante de las herramientas OLAP son sus operadores de refinamiento o manipulación de consultas: Drill Roll Slice & Dice Pivot En el agregado de las consultas en el análisis de datos, es aconsejable definir nuevos operadores que faciliten la agregación (consolidación) y la disgregación (división) de los datos: Disgregación (Drill).- Permite introducir un nuevo criterio de agrupación en el análisis, disgregando los grupos actuales. Este operador actúa sobre el informe original, no es necesario realizar un nuevo informe. Por ejemplo supongamos que se quisiera saber las ventas durante el año 2002 de los productos del departamento bebidas, por trimestre, por categoría y por ciudad del almacén. En este caso: La restricción sería: producto del departamento bebidas, ventas durante el año 2002. 32 El parámetro para la consulta: por categoría de producto, por trimestre y por ciudad del almacén. Agregación (ROLL).- Permite eliminar un criterio de agrupación en el análisis, agregando los grupos actuales. Este operador también, actúa sobre el informe original y no requiere que el usuario realice uno nuevo. Por ejemplo si se desee eliminar el criterio de agregación sobre la dimensión tiempo en la consulta original, como ser saber el importante total de las ventas durante el año 2002 de los productos del departamento bebidas, por categoría. En la Figura 2.1 puede observarse el funcionamiento de este operador. Estas operaciones se pueden hacer sobre: Atributos de una dimensión sobre los que se ha definido una jerarquía: Drill – Down, Roll – Up. Sobre dimensiones independientes: Drill – Across, Roll – Across. 33 Otras operaciones de OLAP son las siguientes: Slice & Dice: este operador permite seleccionar y proyectar datos en el informe. La siguiente Figura 2.2 ilustra el funcionamiento de este operador. Pivot: Permite la reorientación de la dimensiones en el informe. En la Figura 2.3 se puede observar este operador. 34 Las herramientas OLAP se caracterizan por lo siguiente: Permiten una visión multidimensional de los datos a los usuarios (matricial). No impone ningún tipo de restricciones sobre el número de dimensiones. Ofrece simetría para las dimensiones. No ofrece ningún tipo de limitación a la hora de definir las dimensiones: restricción, agregación y jerarquía entre ellas. Ofrece operadores intuitivos de manipulación: drill – down, roll – up, slice & dice, pivot. Es transparente al tipo de tecnología que soporta el almacén de datos (ROLAP, MOLAP). 2.2.6.3. Tipos de Organizaciones Como se había comentado en los almacenes de datos y las herramientas OLAP pueden basarse físicamente en varias organizaciones: Sistemas ROLAP: se los implementa sobre tecnología relacional, pero posee facilidades que mejoran el rendimiento. En estos sistemas el almacén de datos se construye sobre SGBD relacional. Los fabricantes de estos productos ofrecen extensiones y herramientas para poder utilizar el SGBD como un sistema gestor de almacenes de datos. Las extensiones de los SGBD son los siguientes: Índice de mapas de bits. Índice de join. Técnicas de particionamiento de los datos. Optimizadores de consultas. Extensiones de SQL. Sistemas MOLAP: Poseen estructuras de almacenamiento específicas y técnica de compactación de datos que favorecen el rendimiento del almacén. El objetivo de estos sistemas es almacenar físicamente los datos en estructuras multidimensionales de forma que la representación externa y la presentación internan coincidan. El servidor OLAP construye y almacena datos en estructuras multidimensionales y la herramienta OLAP presenta estas estructuras multidimensionales. Características principales: Los datos son: Arrays. Extraídos del almacén de datos. El almacenamiento y los procesos son considerablemente eficientes. Se oculta al usuario la complejidad de las bases de datos. 35 El análisis se realiza sobre datos agregados y métrica o indicadores pre calculados. Sistemas HOLAP: Estos sistemas son considerados híbridos debido a que posee características de los dos sistemas explicados antes. 2.2.6.4. Ventajas e Inconvenientes de los sistemas MOLAP Beneficios Mayor performance en la ejecución de queries. Poco tiempo de cálculos realizados en el momento. Puede escribir sobre la base de datos. Posibilita hacer cálculos más sofisticados. Desventajas Tamaño limitado por la arquitectura del cubo. No puede acceder a datos que no están en cubos. Housekeeping / Backups limitados. No puede explotar el paralelismo de las bases de datos. 2.2.6.5. Ventajas e Inconvenientes de los Sistemas ROLAP Beneficios Uso total de la seguridad e integridad de la base de datos. Escalable para grandes volúmenes. La data puede ser compartida con otras aplicaciones SQL. Data y estructura más dinámicas. Desventajas Queries más lentos. Construcción cara. Los índices y sumarios no son mantenidos automáticamente. Los cálculos están limitados a las funciones de la base de datos. Menos abiertos, ya que tiene clientes propietarios. 36 2.2.6.6. Conceptos 2.2.6.6.1. Multidimensionales Multidimensionalidad es convertir los datos de varias fuentes, tablas relacionales o archivos planos en una estructura donde los datos estén agrupados en dimensiones separadas y heterogéneas, que generalmente son llamadas “cubo”. Las dimensiones son perspectivas de alto nivel de los datos que representan la información más importante de un negocio. En un banco se tendrán Cuentas, Clientes, Tiempo, Productos, Agencias, Regiones, etc. En una aplicación OLAP estas dimensiones tienden a no cambiar durante el tiempo. Cada dimensión tiene componentes que son llamados “miembros”. Por ejemplo el primer trimestre del año es un miembro de la dimensión Tiempo. Cada dimensión puede tener jerarquías entre sus miembros, por ejemplo un mes se puede considerar dentro de un trimestre. En la Figura 2.4 se ejemplifica mediante un dibujo este concepto. El esquema multidimensional puede ser implementado por un esquema relacional. Dos tipos de esquemas relacionales pueden implementar un esquema multidimensional: esquema en estrella (start schema) y esquema copo de nieve (snowflake schema). 37 2.2.6.6.2. Esquema en Estrella Un modelos estrella es un modo de representar datos multidimensionales en base de datos relacional. Las tablas de dimensión guardan información descriptiva acerca de sus miembros y sus relaciones, mientras que las tablas de hechos almacenan datos de negocios. Los queries multidimensionales son hechos haciendo joins entre las tablas de hechos y de dimensión. Los sistemas OLAP que utilizan este tipo d modelo de base de datos son llamados sistemas ROLAP. En la figura 2.5 se puede observar lo descrito anteriormente. 38 2.2.6.6.3. Medidas Una medida es un tipo de dato cuya información es usada por los analistas (usuarios) en sus queries para medir la performance del comportamiento de un proceso o un objeto del negocio. Por ejemplo: cantidades, tamaños, montos, duraciones, etc. Las medidas candidatas son los datos numéricos, pero no cada atributo numérico es una medida candidata. Son parte de dominio de valor continuo, se deben distinguir las medidas de atributos discretos que son parte de las dimensiones. Se podría decir que son las que están involucradas en cálculos de resúmenes. 2.2.6.6.4. Dimensiones Una dimensión es una entidad o una colección de entidades relacionadas, usadas por los analistas para identificar el contexto de las medidas con las que trabajan, estas determinan el contexto para las medidas. El número y tipo de dimensiones para cada medida del modelo debe ser determinada cuidadosamente. El significado de una medida está influenciado por las definiciones de los tipos de medidas que tiene. Cuando se trata de definir las dimensiones candidatas cambia el contexto y en consecuencia el significado de la medida candidata. Las dimensiones son referenciadas por las llamadas “llaves de dimensión”. Las dimensiones contienen: Entidades de dimensión. Atributos de dimensión. Jerarquías de dimensión. Niveles de agregación. 39 2.2.6.6.5. Hechos Un hecho es una colección de medidas relacionadas con sus dimensiones relacionadas, representadas por las llaves de dimensión. Un hecho puede representar un objeto de negocio, una transacción o un evento que es utilizado por el analista de información. En la Figura 2.6 se puede observar ejemplos de hechos. Los hechos contienen: Un identificador de hechos. Llaves de dimensión, que lo enlaza con las dimensiones. Medidas. Varios tipos de atributos, los que usualmente se derivan de otros datos en el modelo. Cada hecho debería tener un equivalente en el mundo real de los negocios. Los hechos relacionados al negocio representan una de las siguientes cosas: Objetos del negocio cuyo estado es de interés del analista de información. Objetos del negocio cuyos cambios de estado son de interés del analista de información. Transacciones o eventos del negocio. 40 2.2.6.6.6. Esquema Copo de Nieve Las bases de datos relacionales a menudo emplean esquemas de copo de nieve para proporcionar los mejores tiempos de respuesta posibles a las consultas complejas. Los esquemas de copos de nieve contienen una tabla de hechos central sin normalizar para el tema y numerosas tablas de dimensión para la información descriptiva sobre las dimensiones del tema. La tabla de hechos puede contener varios millones de filas. La información a la que se tiene acceso con más frecuencia se agrega previamente y se resume para mejorar aún más el rendimiento. Si bien el esquema de copo de nieve se considera fundamentalmente una herramienta con la que el administrador de bases de datos puede aumentar el rendimiento y simplificar el diseño de almacén de datos, también se utiliza para representar la información del almacén de datos de forma que tenga más sentido para los usuarios finales. Suele aplicarse cuando muchos atributos caracterizan a los niveles más altos de jerarquías. Se puede elegir el normalizar sólo algunas dimensiones y otras no, aumentando así la complejidad del diseño y metadatos. El inconveniente es que al aumentar el número de tablas algunos requisitos pueden demorarse en exceso. En resumen: Ventajas No se necesita el atributo de nivel. Fácil para definir jerarquías. Mejorar considerablemente el rendimiento cuando un gran número de requisitos solicita datos agregados. Los requerimientos escanean un reducido número de filas. Desventajas Aumenta la complejidad de mantener la meta información debido al aumento del número de tablas. Si no se dispone de la suficiente cantidad de tablas de agregados, el rendimiento general podría disminuir. 41 No es posible recopilar toda la información necesaria en un único esquema estrella o copo de nieve, por ello se hace necesario utilizar varios esquemas. Cada uno de estos esquemas se denomina Datamart. En la Figura 2.7 se ilustra lo antes mencionado. 42 2.2.7. Casos del Mundo Real Cuando el año pasado fracasaron los planes de fusión de Office Depot con Staples Inc., los analistas del Wall Street, como Donald Spindel, dijeron que a la compañía le tomaría “varios trimestres recuperar el impulso perdido”. Después de todo, el líder del mercado de suministro de oficina había perdido a muchos de sus altos gerentes durante los debates de la infortunada fusión. También había perdido docenas de empleados de oficina que solían ayudar a generar informes sobre ventas de productos en sus 600 tiendas de Estados Unidos. Pero gracias a su incremento en el uso de software de procesamiento analítico en línea (OLAP) por parte de sus 200 comercializadores y ejecutivos de finanzas, Office Depot se las arregló para generar un crecimiento “respetable” de 4% en las ventas durante el segundo semestre del año pasado. Al equipar a sus comercializadores con sus propias herramientas analíticas, la empresa con sede en Delay, Florida, pudo “operar en forma más eficiente, sin las personas que perdió”, dijo Spindel. Office Depot comenzó a utilizar Wired para software OLAP a comienzo de 1996. Esto ha permitido centenares de comercializadores, vendedores y ejecutivos iniciar sus propias consultas y “dar un nuevo enfoque a la empresa”, dice Bob Nickerson, director de planeación de mercancía e información en Office Depot. Por ejemplo, en el otoño de 1996, Nickerson y otros 100 comercializadores de Office Depot utilizaron Essbase para revisar el negocio de los computadores personales del minorista, generando análisis detallados del margen bruto del retorno sobre las inversiones, por tienda y por tipo de producto. “Encontramos que teníamos demasiadas existencias marginales en las tiendas equivocadas”, dijo Nickerson. Por tanto, el minorista redujo su surtido de computadores personales de 22 a 112 productos. Esto ayudó a la empresa a eliminar el inventario innecesario y evitar costosas reducciones de precios en los equipos que se estaban cubriendo de polvo. A su vez, el retorno sobre activos de Office Depot en su negocio de los computadores “ha mejorado sustancialmente”, dice Nickerson. Él se reusó a cuantificar esas ganancias específicas, pero dijo que el uso, por parte de la empresa, del Essbase y Wired para herramientas OLAP “se ha traducido en millones de dólares en rentabilidad”. El año pasado, Office Depot ocupó el tercer lugar entre los minoristas de computadores, con 2590 millones de dólares en venta, después de las tiendas CompUSA y Best Buy. Incluso Dilbert, al que Office Depot ha otorgado licencia de uso de su actual campaña publicitaria, pasaría por un momento difícil al referirse únicamente a los retornos que Office Depot ha logrado sobre su inversión inferior a 5 millones de dólares en software Essbase y servidores Compaq 7000. Para allanar el camino realizó un esfuerzo de cinco años, ya terminado, con el fin de reemplazar unos cuantos 43 computadores AS/400 de rango intermedio de IBM por un mainframe 900-MIPS de IBM que corre con DB2. Es posible que un desplazamiento hacia el procesamiento en mainframe no suene muy seductor, pero Office Depot acabó con sistemas de buena arquitectura que se desempeñaban bien en el mantenimiento de datos detallados. Esto ayudó a Office Depot a establecer un ambiente limpio de apoyo a las decisiones que comprende 4 terabytes, principalmente de datos DB2 y 300 gigabytes de información Essbase que se almacena en plazas de datos o “cubos”. Paul Gaffney, vicepresidente senior de desarrollo de sistemas de Office Depot, dice: “Habría sido imposible entregar tales datos si no tuviéramos una buena arquitectura de éstos”. Pero el éxito no se ha producido fácilmente. Un solo cubo puede contener hasta 30000 productos y hasta 53 semanas de datos financieros para cada una de sus 600 tiendas, dice Nickerson. Y cuando los cubos crecen demasiado, los servidores de disco de Office Depot se atascan. Para deshacer estos cuellos de botella, Office Depot adquirió unidades de disco magnético RAID de múltiples canales de IBM. Esto ayudó a que las plazas de datos generaran respuestas en fracciones de segundos “a cualquier solicitud de indagación” en cubos diseñados previamente, dice Gaffney. Office Depot está considerando la posibilidad de dar a los proveedores acceso extranet a sus plazas de datos utilizando la actividad de ventas con dos proveedores claves a través de series de transacciones de intercambio electrónico de datos, de manera que “tenemos que decidir si realmente necesitamos enviarles dicha información por medio de Essbase”, dijo Nickerson. 44 2.2.8 Persistencia MOLAP, ROLAP, HOLAP Los cubos, las dimensiones y las jerarquías son la esencia de la navegación multidimensional del OLAP. Al describir y representar la información en esta forma, los usuarios pueden navegar intuitivamente en un conjunto complejo de datos. Sin embargo, el solo describir el modelo de datos en una forma más intuitiva, hace muy poco para ayudar a entregar la información al usuario más rápidamente. Un principio clave del OLAP es que los usuarios deberían obtener tiempos de respuesta consistentes para cada vista de datos que requieran. Dado que la información se colecta en el nivel de detalle solamente, el resumen de la información es usualmente calculado por adelantado. Estos valores pre-calculados son la base de las ganancias de desempeño del OLAP. En los primeros días de la tecnología OLAP, la mayoría de las compañías asumía que la única solución para una aplicación OLAP era un modelo de almacenamiento no relacional. Después, otras compañías descubrieron que a través del uso de estructuras de base de datos (esquemas de estrella y de copo de nieve), índices y el almacenamiento de agregados, se podrían utilizar sistemas de administración de bases de datos relacionales (RDBMS) para el OLAP. Estos vendedores llamaron a esta tecnología OLAP relacional (ROLAP). Las primeras compañías adoptaron entonces el término OLAP multidimensional (MOLAP), estos conceptos, MOLAP y ROLAP, se explican con más detalle en los siguientes párrafos. Las implementaciones MOLAP normalmente se desempeñan mejor que la tecnología ROLAP, pero tienen problemas de escalabilidad. Por otro lado, las implementaciones ROLAP son más escalables y son frecuentemente atractivas a los clientes debido a que aprovechan las inversiones en tecnologías de bases de datos relacionales preexistentes. 45 2.2.9 Procesamiento y Modos de Almacenamiento de Particiones ( SQL Server 2008 R2 ) El modo de almacenamiento de una partición afecta al rendimiento de las consultas y el procesamiento, a los requisitos de almacenamiento y a las ubicaciones de almacenamiento de la partición y de su grupo de medida y cubo primario. La elección del modo de almacenamiento afecta también a las opciones de procesamiento. Una partición puede utilizar uno de estos tres modos de almacenamiento básicos: OLAP multidimensional (MOLAP) OLAP relacional (ROLAP) OLAP híbrido (HOLAP) MicrosoftSQL ServerAnalysis Services admite los tres modos de almacenamiento básicos. También admite el almacenamiento en caché automático, que permite combinar las características de almacenamiento ROLAP y MOLAP para mejorar la disponibilidad de los datos y el rendimiento de las consultas. Para obtener más información, vea Almacenamiento en caché automático (Particiones). MOLAP (SQL Server 2008 R2) El modo de almacenamiento MOLAP da lugar a que las agregaciones de la partición y una copia de sus datos de origen se almacenen en una estructura multidimensional en Analysis Services. Esta estructura MOLAP está muy optimizada para maximizar el rendimiento de las consultas. La ubicación de almacenamiento puede estar en el equipo en donde se define la partición o en otro equipo que ejecute Analysis Services. Dado que una copia de los datos de origen reside en la estructura multidimensional, las consultas se pueden resolver sin necesidad de obtener acceso a los datos de origen de la partición. Si se utilizan agregaciones, los tiempos de respuesta a las consultas pueden disminuir notablemente. Los datos de la estructura MOLAP de la partición están tan actualizados como el procesamiento más reciente de la misma. A medida que cambian los datos de origen, los objetos con almacenamiento MOLAP se deben procesar periódicamente para incorporar estos cambios y ponerlos a disposición de los usuarios. El procesamiento actualiza los datos en la estructura MOLAP, ya sea completamente o incrementalmente. El tiempo entre un procesamiento y el siguiente crea un periodo de latencia durante el cual los datos de los objetos OLAP podrían no coincidir con los datos de origen. Es posible actualizar los objetos en almacenamiento MOLAP completamente o incrementalmente sin desconectar la partición o el cubo. Sin embargo, hay casos en que se puede exigir que se desconecte un cubo para procesar algunos cambios estructurales de objetos OLAP. El tiempo de inactividad requerido para actualizar el almacenamiento MOLAP se puede minimizar actualizando y procesando cubos en un servidor de ensayo y utilizando la sincronización de bases de datos para copiar los objetos procesados en el servidor de producción. También se puede usar el almacenamiento en caché automático para 46 minimizar la latencia y maximizar la disponibilidad, a la vez que se mantiene gran parte de las ventajas de rendimiento del almacenamiento MOLAP. ROLAP(SQL Server 2008 R2) El modo de almacenamiento ROLAP hace que las agregaciones de la partición se almacenen en vistas indizadas de la base de datos relacional que se especificó en el origen de datos de la partición. A diferencia del modo de almacenamiento MOLAP, ROLAP no hace que se almacene una copia de los datos del origen en las carpetas de datos de Analysis Services. En su lugar, cuando no se pueden derivar los resultados de la caché de consultas, se utilizan las vistas indizadas del origen de datos para responder a las consultas. La respuesta a las consultas suele ser más lenta con el almacenamiento ROLAP que con los modos de almacenamiento MOLAP o HOLAP. El tiempo de procesamiento también suele ser más lento con ROLAP. No obstante, ROLAP permite a los usuarios ver los datos en tiempo real y ahorrar espacio de almacenamiento al trabajar con conjuntos de datos grandes a los que no se suele consultar con frecuencia, como datos puramente históricos. HOLAP(SQL Server 2008 R2) El modo de almacenamiento HOLAP combina atributos de los modos MOLAP y ROLAP. Al igual que MOLAP, HOLAP hace que las agregaciones de la partición se almacenen en una estructura multidimensional de una instancia de SQL ServerAnalysis Services.HOLAP no hace que se almacene una copia de los datos de origen. HOLAP es el equivalente de MOLAP para las consultas que sólo tienen acceso a los datos de resumen de las agregaciones de una partición. Las consultas con acceso a los datos de origen como, por ejemplo, la obtención de detalles para una celda de un cubo atómico sin datos de agregación, deben recuperar datos de la base de datos relacional y no serán tan rápidas como lo serían si los datos de origen se hubieran almacenado en la estructura MOLAP. Con el modo de almacenamiento HOLAP, los usuarios suelen experimentar notables diferencias en cuanto a los tiempos de las consultas según si la consulta se puede resolver desde la caché o las agregaciones frente a los propios datos de origen. Las particiones almacenadas como HOLAP son más pequeñas que sus equivalentes MOLAP dado que no contienen datos de origen y responden más rápidamente que las particiones ROLAP a las consultas que implican datos de resumen. El modo de almacenamiento HOLAP suele ser más adecuado para particiones en cubos que requieren una respuesta de consultas rápida para resúmenes basados en una gran cantidad de datos de origen. No obstante, si los usuarios generan consultas que deben utilizar datos del nivel hoja (por ejemplo, para calcular valores medios), MOLAP suele ser una opción mejor. 47 2.3. DEFINICION DE TERMINOS 1 INTERNET 2 INTRANET 3 HOSTING 4 5 SERVIDOR COMPARTIDO SERVIDOR VIRTUAL 6 SERVIDOR DEDICADO 7 BASE DE DATOS 8 ERP Infraestructura de redes a escala mundial que se conecta a la vez a todo tipo de computadores. Desarrollado originariamente para los militares de Estados Unidos, después se utilizó para el gobierno, la investigación académica y comercial y para comunicaciones. Red de ordenadores privada basada en los estándares de Internet, utilizan esta tecnología para enlazar los recursos informativos de una organización, desde documentos de texto a documentos multimedia, desde bases de datos legales a sistemas de gestión de documentos. Alojar, servir, y mantener archivos para uno o más sitios web. Es también conocido como hospedaje web, alojamiento web, web site hosting, web hosting o webhosting. El tipo de empresa que ofrece estos servicios se denomina ISP (por Internet Service Provider). Es una forma de hosting en la que varios clientes comparten un mismo servidor. Se conoce como servidor virtual a una partición dentro de un servidor que habilita varias máquinas virtuales dentro de dicho equipo por medio de diferentes tecnologías. Los servidores virtuales tienen un límite de uso de CPU y memoria RAM (entre otros) que se dedica sólo para ese SDV dentro del servidor, y cada uno de ellos funciona independientemente dentro de un mismo servidor, es decir que todos actúan como jaulas dentro de un mismo equipo. Por ejemplo, si uno de ellos está mal administrado y trabaja en forma sobrecargada, no afectará el funcionamiento del resto. El uso exclusivo de todo un servidor por un único cliente. Es una Forma de Hosting. Al ser dedicado, su costo puede ser alto. Una base de datos o banco de datos (en ocasiones abreviada con la sigla BD o con la abreviatura b. d.) es un conjunto de datos pertenecientes a un mismo contexto y almacenados sistemáticamente para su posterior uso. La Planificación de Recursos Empresariales, o simplemente ERP (Enterprise Resourse Planning), es un conjunto de sistemas de información gerencial que permite la integración de ciertas operaciones de una empresa, especialmente las que tienen que ver con la producción, la logística, el inventario, los envíos y la contabilidad. 48 9 CRM 10 SCM 11 BUSINESS INTELLIGENCE 12 CADENA DE VALOR 13 CLUSTER DE APLICACIONES 14 BACK END 15 FRONT END 16 DATA MINING 17 EIS 18 ESTUDIO DE MERCADO Customer Relationship Management, gestión de las relaciones con el cliente. El CRM no es una nueva filosofía de trabajo u organización, sino el resultado de unir las antiguas técnicas comerciales de los pequeños establecimientos, con la tecnología de la información. Supply Chain Management (SCM). Es una solución de negocios enfocada en optimizar la planeación y las operaciones de la cadena de suministro de la empresa. Las aplicaciones de Business Intelligence (BI) son herramientas de soporte de decisiones que permiten en tiempo real, acceso interactivo, análisis y manipulación de información crítica para la empresa. Se enfoca en la identificación de los procesos y operaciones que aportan valor al negocio, desde la creación de la demanda hasta que ésta es entregada como producto final. Los clusters o agrupamientos que ejecutan aplicaciones utilizadas en el cómputo científico, donde lo más importante es obtener un alto desempeño, optimizando el tiempo de procesamiento. Algunas aplicaciones de este tipo son los ERP (Enterprise Resource Plannig), BI (Business Intelligence), Herramientas OLAP, KWS (Sistemas basados en el conocimiento), ESS (Sistemas de soporte para ejecutivos). De forma general, back-end hace referencia al estado final de un proceso. Contrasta con front-end, que se refiere al estado inicial de un proceso, interfaz del administrador o programador de la aplicación. Front-end hace referencia al estado inicial de un proceso. Contrasta con back-end, que se refiere al estado final de un proceso, interfaz del usuario final. La minería de datos (Data Mining) consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos. Los sistemas de información ejecutiva (EIS, Executive Information System) son el tipo de DSS que más se suele emplear en Business Intelligence, ya que proveen a los gerentes de un acceso sencillo a información interna y externa de su compañía, y que es relevante para sus factores clave de éxito. Recopilación y análisis de información, en lo que respecta al mundo de la empresa y del mercado, 49 19 NEGOCIO BRICK 20 NEGOCIO CLIC 21 OLAP 22 ROLAP 23 MOLAP 24 HOLAP 25 METADATOS realizado de forma sistemática o expresa, para poder tomar decisiones dentro del campo del marketing estratégico y operativo. Organización que tiene participación comercial de forma tradicional, es decir, con instalaciones físicas. También podemos econtrarlo escrito como Negocio Brick & Mortar (por "ladrillo y cemento"). Organización que tiene participación comercial de forma electrónica únicamente. También se denomina una empresa "punto com" OLAP es el acrónimo en inglés de Procesamiento Analítico en Línea Es una solución utilizada en el campo de Business Intelligence cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas similares. Implementación OLAP que almacena los datos en un motor relacional. Típicamente, los datos son detallados, evitando las agregaciones y las tablas se encuentran desnormalizadas Los esquemas más comunes sobre los que se trabaja son estrella ó copo de nieve, aunque es posible trabajar sobre cualquier base de datos relacional. La arquitectura está compuesta por un servidor de banco de datos relacional y el motor OLAP se encuentra en un servidor dedicado. La principal ventaja de esta arquitectura es que permite el análisis de una enorme cantidad de datos. Esta implementación OLAP almacena los datos en una base de datos multidimensional. Para optimizar los tiempos de respuesta, el resumen de la información es usualmente calculado por adelantado. Estos valores precalculados o agregaciones son la base de las ganancias de desempeño de este sistema. Algunos sistemas utilizan técnicas de compresión de datos para disminuir el espacio de almacenamiento en disco debido a los valores precalculados. Es una combinación de ROLAP y MOLAP, que son otras posibles implementaciones de OLAP. HOLAP permite almacenar una parte de los datos como en un sistema MOLAP y el resto como en uno ROLAP. El grado de control que el operador de la aplicación tiene sobre este particionamiento varía de unos productos a otros. Datos estructurados y codificados que describen características de instancias conteniendo informaciones 50 26 DATAWAREHOUSE 27 CUBO OLAP MULTIDIMENSIONAL 28 REPORTE GENERICO 29 PERSISTENCIA DE DATOS 30 DISGREGACION (DRILL) 31 AGREGACION (ROLL) 32 SLICE & DICE 33 PIVOT para ayudar a identificar, descubrir, valorar y administrar las instancias descritas. Es una base de datos corporativa que se caracteriza por integrar y depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de perspectivas y con grandes velocidades de respuesta. Un cubo OLAP, OnLine Analytical Processing o procesamiento Analítico En Línea, es una base de datos multidimensional, en la cual el almacenamiento físico de los datos se realiza en un vector multidimensional. Los cubos OLAP se pueden considerar como una ampliación de las dos dimensiones de una hoja de cálculo. Los reportes genéricos son un conjunto de reportes, gráficos e histogramas adaptables a la necesidad de cada cliente. Consiste en un conjunto NO FIJO de consultas que pueden ser visualizadas por pantalla o impresas y que muestran información del sistema pero en un formato personalizable por el cliente. La persistencia de datos es la representación residual de datos que han sido de alguna manera nominalmente borrados o eliminados. Este residuo puede ser debido a que los datos han sido dejados intactos por un operativo de eliminación nominal, o por las propiedades físicas del medio de almacenaje. La persistencia de datos posibilita en forma inadvertida la exhibición de información sensible si el medio de almacenaje es dejado en un ambiente sobre el que no se tiene control (p. ej., se tira a la basura, se le da a un tercero). Permite introducir un nuevo criterio de agrupación en el análisis, disgregando los grupos actuales. Este operador actúa sobre el informe original, no es necesario realizar un nuevo informe. Permite eliminar un criterio de agrupación en el análisis, agregando los grupos actuales. Este operador también, actúa sobre el informe original y no requiere que el usuario realice uno nuevo. Por ejemplo si se desee eliminar el criterio de agregación sobre la dimensión tiempo en la consulta original, como ser saber el importante total de las ventas durante el año 2002 de los productos del departamento bebidas, por categoría Este operador permite seleccionar y proyectar datos en el informe. Permite la reorientación de la dimensiones en el informe. 51 2.4. SISTEMA DE HIPOTESIS Se quiere implementar un cuadro de cuadro de Mando Integral Gerencial, que integrará los indicadores de gestión orientado a proporcionar la estructura de un sistema de gestión y medición estratégica del mismo, tomando en consideración las siguientes tecnologías: Implementación ROLAP que almacena los datos en un motor relacional. Típicamente, los datos son detallados, evitando las agregaciones y las tablas se encuentran desnormalizadas. La arquitectura está compuesta por un servidor de banco de datos relacional y el motor OLAP se encuentra en un servidor dedicado. La principal ventaja de esta arquitectura es que permite el análisis de una enorme cantidad de datos. La implementación MOLAP almacena los datos en una base de datos multidimensional. Para optimizar los tiempos de respuesta, el resumen de la información es usualmente calculado por adelantado. Estos valores precalculados o agregaciones son la base de las ganancias de desempeño de este sistema. Algunos sistemas utilizan técnicas de compresión de datos para disminuir el espacio de almacenamiento en disco debido a los valores precalculados. La implementación de la solución OLAP híbrida (HOLAP), la cual combina las arquitecturas ROLAP y MOLAP para brindar una solución con las mejores características de ambas: desempeño superior y gran escalabilidad. Un tipo de HOLAP mantiene los registros de detalle (los volúmenes más grandes) en la base de datos relacional, mientras que mantiene las agregaciones en un almacén MOLAP separado. HIPOTESIS ROLAP MOLAP HOLAP Información Tiene Proyección Total 3 4 5 3 3 4 6 7 9 52 Comparación: Cada sistema OLAP tiene ciertos beneficios (aunque existe desacuerdo acerca de las características específicas de los beneficios entre los proveedores). Algunas implementaciones MOLAP son propensas a la "explosión" de la base de datos; este fenómeno provoca la necesidad de grandes cantidades de espacio de almacenamiento para el uso de una base de datos MOLAP cuando se dan ciertas condiciones: elevado número de dimensiones, resultados precalculados y escasos datos multidimensionales. Las técnicas habituales de atenuación de la explosión de la base de datos no son todo lo eficientes que sería deseable. ROLAP es generalmente más escalable. Sin embargo, el gran volumen de preprocesamiento es difícil de implementar eficientemente por lo que con frecuencia se omite; por tanto, el rendimiento de una consulta ROLAP puede verse afectado. Desde la aparición de ROLAP van apareciendo nuevas versiones de bases de datos preparadas para realizar cálculos, las funciones especializadas que se pueden utilizar tienen más limitaciones. HOLAP (OLAP Híbrido) engloba un conjunto de técnicas que tratan de combinar MOLAP y ROLAP de la mejor forma posible. Generalmente puede pre-procesar rápidamente, escala bien, y proporciona una buena función de apoyo. Las particiones almacenadas como HOLAP son más pequeñas que sus equivalentes MOLAP dado que no contienen datos de origen y responden más rápidamente que las particiones ROLAP a las consultas que implican datos de resumen. El modo de almacenamiento HOLAP suele ser más adecuado para particiones en cubos que requieren una respuesta de consultas rápida para resúmenes basados en una gran cantidad de datos de origen. Particionamiento Vertical En este modo, HOLAP almacena agregaciones como un MOLAP para mejorar la velocidad de las consultas, y los datos se detallan en ROLAP para optimizar el tiempo en que se procesa el cubo. Particionamiento Horizontal En este modo HOLAP almacena una sección de los datos, normalmente los más recientes (por ejemplo particionando por la dimensión tiempo) en modo MOLAP para mejorar la velocidad de las consultas, y los datos más antiguos en ROLAP. Además, se pueden almacenar algunos cubos en MOLAP y otros en ROLAP. 53 2.5. SISTEMA DE VARIABLES Variable Dependiente Coste, plazos de entrega, utilidad, calidad de los datos, usabilidad por los usuarios, implicación de la compañía, contribución a los resultados. Variable Independiente La Plataforma: No es lo mismo estar atados a Microsoft, o poder trabajar en Unix, o tener una estrategia Open Source Linux. Lo mismo aplica al hardware. Algunos fabricantes son restrictivos. . El tamaño del cubo: Es imprescindible hacer un análisis previo de la amplitud de la información a almacenar. Algunas aplicaciones pueden 'explotar' llegado cierto nivel. La velocidad de consulta: Los usuarios siempre quieren velocidad en sus consultas. Y si 20 segundos de espera es mucho, quizás haya que buscar otra herramienta. Servicios de Soporte : La elección de los consultores y excesiva rotación entre ellos. Indicadores: . Evaluaciones de analistas: Gartner, IDC saben de que hablan... y suelen ser objetivos. No está de más fijarse en sus 'cuadrantes'. . El ecosistema del vendedor (consultores, partners, acuerdos, comunidad de desarrolladores…). Base instalada de usuarios. Si hay de mi sector mucho mejor. Si puedo hablar con ellos y ver la herramienta en vivo, todavía mejor. . Graphical User Interface (GUI). Hay que recordar que hablamos de una herramienta para usuarios finales y si a éstos no les gusta, no la utilizarán y será dinero tirado. El Precio: No tiene por qué ser lo más importante..... pero... es importante!!! Integración con otras herramientas: Ninguna herramienta funciona como una isla aislada del resto. Lo mismo que una empresa, si creas islas, crearás incomunicación. 54 CAPÍTULO III: ASPECTOS ADMINISTRATIVOS 3.1 NIVEL DE INVESTIGACION Investigación Descriptiva El hecho de proporcionar a los clientes herramientas que puedan utilizar por si mismos. Para crear un entorno de autosuficiencia en lo que a BI se refiere, se debe crear un grupo con clientes de la empresa y proveedores de TI para determinar cuáles son las necesidades de la organización y a partir de este momento determinar que herramientas se van a desplegar. 3.2 DISEÑO DE LA INVESTIGACION Investigación de Campo: Se Evidencian Las Discrepancias Entre La Gente de IT y Los Usuarios de Negocio Más o menos, de toda la gente que ha encuestado Gartner podemos decir que un 60% son IT y un 40% son usuarios de negocio (más o menos…) . Cuando se les preguntó sobre cuáles son los factores más importantes a la hora de elegir un proveedor de BI los usuarios de negocio contestaron que lo más importante es la facilidad de uso y después la funcionalidad de la herramienta. La gente de IT, ante la misma pregunta, contestó que para ellos es más importante la funcionalidad y luego la facilidad de uso. Esto es tremendamente evidente. El usuario de negocio quiere la herramienta más sencilla posible para capear sus carencias técnicas ya que al fin y al cabo su trabajo no consiste en pelearse con una herramienta informática “súper compleja”. Y por otra parte el personal de IT quiere que la herramienta cubra la mayor funcionalidad posible, por que lo que no cubra la herramienta se lo van a pedir de igual forma y va a tener que buscarse la vida para hacerlo funcionar. ¿Cómo solucionar esto? Difícil tarea. Posiblemente veremos en el futuro una tendencia a banalizar la inherente complejidad técnica de un proyecto BI en soluciones muy bonitas pero aisladas y poco integradas, aumentando así la dependencia de IT que es precisamente lo que queremos minimizar. Gartner dice que al usuario de negocio no le importa tanto que la solución sea estándar o integrada con tal de que le sirva para resolver el trabajo que tiene que hacer ahora. Creo que tenemos que tener cuidado, ya que si al final los usuarios de negocio se convierten en dueños de las implantaciones de BI podemos terminar en una versión moderna del excel-hell… 55 CAPÍTULO IV: EVALUACION ECONOMICA 4.1 Recursos: Humanos, Materiales, Financieros FACTOR DE PLANILLA 1.35 PROYECTO COSTEO MENSUAL Fecha Incio PROYECTO Ext Solutions (Aplicativo de Reportes Genéricos) JEFE DE PROYECTO Jefe de Proyecto SUBTOTAL 1 ANALISTAS DE SISTEMAS Analista de Sistemas 01 Analista de Sistemas 02 SUBTOTAL 2 Meses Asignado 4.00 Meses Asignado 4.00 6.00 Sueldo 5000 Otras asignacio nes 0 Sueldo 4500 3800 Otras asignacio nes 0 0 Fecha Fin 03/01/2012 29/10/2012 TIPO DE CAMBIO 1 Costo Mensual S/. 6,750.00 S/. 6,750.00 S/. 6,750.00 Costo Total S/. 27,000.00 S/. 27,000.00 S/. 27,000.00 Costo Mensual S/. 6,075.00 S/. 5,130.00 S/. 11,205.00 S/. 11,205.00 Costo Total 24,300.00 30,780.00 55,080.00 30,780.00 S/. S/. S/. S/. ANALISTAS PROGRAMADORES Analista Programador 01 Analista Programador 02 SUBTOTAL 3 PROGRAMADORES Programador 1 Programador 2 Programador 3 Movilidades / Refrigerios SUBTOTAL 4 EQUIPOS DE COMPUTO / UTILITARIOS NOTEBOOK COMPUTADORA DE ESCRITORIO COMPATIBLE IMPRESORA LASER COLOR IMPRESORA DE INYECCION A TINTA ESTABILIZADOR (ENTERPRISE > 1 KVA) Movilidad Utilies de Oficina Celulares SUBTOTAL 5 Meses Asignado 5.00 6.00 Meses Asignado 6 7 7 7 Sueldo 2800.00 2500.00 Otras asignacio nes 0 0 Sueldo 1800 1500 1200 30 Otras asignacio nes 0 0 0 0 Costo Mensual S/. 3,780.00 S/. 3,375.00 S/. 3,375.00 S/. 3,375.00 Costo Mensual S/. 2,430.00 S/. 2,025.00 S/. 1,620.00 S/. 30.00 S/. 6,105.00 S/. 6,105.00 S/. S/. S/. S/. S/. S/. S/. S/. PU Costo Total 18,900.00 20,250.00 39,150.00 59,400.00 Costo Total 14,580.00 14,175.00 11,340.00 210.00 S/. 40,305.00 S/. 66,030.00 Q 3 4 2 2 4 5 12 S/. S/. S/. S/. S/. S/. S/. 2,400.00 2,200.00 250.00 300.00 90.00 50.00 40.00 S/. S/. S/. S/. S/. S/. S/. 7,200.00 8,800.00 500.00 600.00 360.00 250.00 480.00 3 S/. 180.00 S/. 540.00 240 S/. 12,710.00 57 PT S/. 18,730.00 VARIOS Contingencia S/. S/. 15,000.00 SUBTOTAL 7 S/. 15,000.00 COSTO TOTAL X EL SERVICIO S/. 216,940.00 1 COSTO TOTAL S/. 15,000.00 216,940.00 S/. 216,940.00 COSTO TOTAL S/. 216,940.00 UTILIDAD S/. 32,541.00 S/. 249,481.00 . MARGEN 15.00% TOTAL A FACTURAR 58 4.2 Cronograma de Actividades. Diagrama de Gantt 4.3 Análisis Económico-Financiero del Proyecto Indicadores de Riqueza (Cantidad de Dinero) VAN CAUE / VAUE Indicadores de Rentabilidad (Velocidad de Generación de Riqueza): TIR TIR corregida VAN / I R B/C Indicadores Misceláneos: Período de Recuperación (Payback) Punto de Equilibrio (Break Even). VAN: Valor Actual Neto n Fj j j 1 1 i VAN Inv. Donde: Fj = Flujo Neto en el Período j Inv = Inversión en el Período 0 i = Tasa de Descuento del Inversionista (TMAR) n = Horizonte de Evaluación TIR: Tasa Interna de Retorno Corresponde a aquella tasa descuento que hace que el VAN del proyecto sea exactamente igual a cero. 0 I 0 F1 F2 Fn ...... 1 2 1 TIR 1 TIR 1 TIRn n Fj j j 1 1 TIR 0 Inv . Donde: Fj = Flujo Neto en el Período j Inv = Inversión en el Período 0 n = Horizonte de Evaluación Un proyecto es rentable para un inversionista si el VAN es mayor que cero. » VAN > 0 Proyecto Rentable (realizarlo) » VAN < 0 Proyecto NO Rentable (archivarlo) » VAN 0 Proyecto Indiferente El proyecto resulta ser muy rentable ya presenta un: • VAN = 24,857,00 Corresponde a aquella tasa descuento que hace que el VAN del proyecto sea exactamente igual a cero. El proyecto resulta ser muy rentable ya presenta un: • TIR = 17,26 % BIBLIOGRAFÍA Casares, Claudio: Datawarehousing. México. Henderson & Porter. Usa. Arima, Carlos Hideo: Sistemas de informações gerenciais. Brasil. Laundon y Laundon Kimball, Ralph: Aprofundando-se no Data Mining. DBMS. Brasil. Peleias, Ivam Ricardo: Controladoria: gestão eficaz utilizando padrões. São Paulo: Saraiva. Did Cabbah, Elias y Carvalho, Roberta: A utilização do data warehouse na geração de informações para tomada de decisão, VIII Congresso ABC, Porto Seguro, Brasil. Rodríguez, Isabel. Aplicando el poder de la información (OLAP). Uruguay. Laporta, Ricardo. Sistemas Informático ERP en Costos (SIGECOS). Uruguay. http://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx http://www.sinnexus.com/business_intelligence/olap_avanzado.aspx http://www.synerplus.es/Informacion-Tecnica/Cuadro-de-mandointegral-----------/307.html http://www.synerplus.es/Informacion-Tecnica/OLAP/310.html http://www.informatica-hoy.com.ar/informatica-tecnologiaempresas/Que-es-ERM-El-tercer-sistema-despues-de-CRM-y-ERP.php http://www.dataprix.com/rolap-vs-molap http://www.informatica-hoy.com.ar/informatica-tecnologiaempresas/Un-sistema-OLAP-para-cada-necesidad.php ANEXO 65