CIO Roundtable ¿Está lista su organización para aprovechar el potencial que ofrece Big Data? Contenido Introducción3 ¿Qué es Big Data?4 ¿Está lista su organización para Big Data? Preguntas relevantes6 Roadmap para una adecuada implementación 8 Insights del panel de expertos9 Opinión de los asistentes10 Conclusiones11 Introducción Big Data, como muchos conceptos y prácticas que actualmente emergen en el rápido ascenso tecnológico, está llamando la atención de las organizaciones que buscan mantenerse actualizadas en temas de tecnología; sin embargo, aún existen muchas preguntas sobre lo que realmente significa este concepto y qué implicaciones tendrá para ellas. Lo cierto es que los volúmenes de datos se han disparado de forma increíble en los últimos años, debido a las distintas plataformas tecnológicas con las que interactuamos día con día, por lo que se vuelve crítico que los directores de información puedan entender y prepararse para administrar una información cada vez más abundante y compleja, a fin de realmente responder las necesidades de sus clientes y tomar una ventaja competitiva en el mercado. Para profundizar sobre el tema, la cuarta sesión de CIO Roundtable tuvo el honor de contar con la visita del especialista John Martelli, Director de Gestión de la Información en Deloitte, y con la colaboración de dos directivos con una amplia experiencia en el manejo de datos masivos. De esta forma, CIO Roundtable cumple con su misión de llevar a sus miembros la información más relevante y de mayor valor para sus organizaciones. El presente documento contiene las ideas más relevantes que surgieron durante la sesión. Esperamos que esta información sea de su interés y le dé nuevas ideas para mejorar el desempeño de su negocio. Atentamente: Omar Camacho Socio de Consultoría Responsable de Clientes y Mercados CIO Roundtable ¿Está lista su organización para aprovechar el potencial que ofrece Big Data? 3 ¿Qué es Big Data? El concepto de Big Data se refiere a juegos de datos tan grandes y complejos que crean retos significativos para la administración de datos tradicionales y sus herramientas de análisis. Generalmente son datos que no están estructurados y provienen de fuentes no tradicionales, generados en su mayoría, en tiempo real. Las fuentes de esta información masiva son numerosas y están creciendo. Entre ellas se encuentran las transacciones de mercados financieros y sitios de comercio electrónico, los chats en redes sociales, las señales de etiquetas RFID, las conversaciones por teléfonos celulares, las cámaras de tráfico urbano, las cámaras de vigilancia, los patrones para búsquedas en la web y navegación, etc. En este sentido, los números que arrojan todas estas plataformas de comunicación son realmente asombrosos: • 6 billones de teléfonos celulares actualmente en uso, los cuales representan el 87% de la población mundial • 1.2 billones de usuarios de la web móvil en el mundo, que representan el 17% de la población mundial • 30 millones de contenidos compartidos en Facebook cada mes • Existen más de 60 billones de dispositivos inteligentes en el mundo y se espera que el número se eleve a más de 200 billones para 2015 • Un 60% de crecimiento en el volumen de datos se pronostica cada año1 Cumplir con el desafío de administrar y aprovechar esta cantidad de datos no es fácil. Muchas organizaciones requieren modificar sus ambientes tradicionales de tecnología de la información (TI), que están diseñados para proporcionar almacenamiento para bajos volúmenes de datos, principalmente estructurados, usando herramientas tradicionales de Business Intelligence (BI). En su lugar, deben considerar adoptar un ambiente de TI más flexible que aproveche las arquitecturas híbridas –por ejemplo, la modalidad de nube- y que tenga la capacidad para manejar múltiples tipos de datos en el rango de petabyte y exabyte. 4 Este uso de tecnología más avanzada en la gestión de datos crea otro reto para las organizaciones: reunir al capital humano que posea la habilidad de desempeñar roles cada vez más híbridos, a fin de sacar provecho real de esta tecnología; para esto se requerirá de talento proveniente de diversas áreas que no están tradicionalmente asociadas con Tecnología, como podrían ser las áreas de mercadotecnia, ventas y otros sectores operativos de negocio. Dimensiones de Big Data Big Data abarca tres dimensiones principales: • Velocidad. Se refiere a la frecuencia de la generación de datos, incluyendo lotes, frecuencia, tiempo real y flujos • Variedad. Son las fuentes de los datos y se pueden clasificar en estructuradas, no estructuradas o semi-estructuradas • Volumen. Es la cantidad de datos, actualmente es medida en terabytes, en un futuro pueden ser petabytes, exabytes y hasta zettabytes Dada esta situación, las compañías deben trabajar para administrar de manera efectiva estos datos no estructurados, y para realizarlo será necesario invertir cada vez más en tecnología de almacenamiento. Gartner proyecta que la información corporativa crecerá más de 650% de 2010 al 2014. Además, se espera que el 80% de los datos no estén estructurados.2 Por lo tanto, es importante que las compañías aprovechen la afluencia de datos para recoger nuevas perspectivas: Big Data representa, ante todo, una fuente sin límite de clientes, productos e inteligencia de mercado. 1 Fuente de información: McKinsey Report International Telecommunication Union 2 Gartner Webinar: Technology Trends You Can’t Afford to Ignore (January 2010) Modelo de Madurez en la Administración de la Información Análisis de datos Administración de datos Establecimiento de los cimientos de Gobierno de Datos Reporteo Procesos estandarizados de negocio Entrega de información aislada por puente Se enfoca menos en lo que pasó y se enfoca en cuál fue la causa Drill downs en un ambiente OLAP Entrega de información integrada por varias fuentes Predictivo Entrega información para efectos de predicción Utiliza minería de datos avanzada y el poder de algoritmos predictivos Rapidez en la información La información debe ser cercana al tiempo real La entrega de información para tomas de decisiones operativas debe de ser realizada en un lapso de tiempo muy corto Identificación de patrones de comportamiento Big Data Entrega de grandes cantidades de información multiestructurada (fuentes estructuradas y no estructuradas) para minería avanzada de datos con fines predictivos Principios de toma de decisiones operativas automatizadas con base en la información entregada CIO Roundtable ¿Está lista su organización para aprovechar el potencial que ofrece Big Data? 5 ¿Está lista su organización para Big Data? Preguntas relevantes Nuestro experto John Martelli recomendó a los miembros de CIO Roundtable que antes de emprender cualquier práctica alrededor de la gestión de datos masivos, es necesario hacer un autoanálisis sobre nuestras expectativas con esta herramienta y hacer un check up de los elementos con los que contamos para su implementación. Conocer este punto de partida nos permitiría tener un mejor retorno de inversión y un mayor control en la gestión de la información. Al respecto, Francisco Rocha, Gerente Senior de SAP de Deloitte Consulting, comentó que las posibilidades e implicaciones de Big Data aún son poco conocidas en nuestro país, por lo que el primer paso es que las empresas mexicanas conozcan de qué trata el tema, definan sus expectativas y revisen aspectos como infraestructura, talento y funciones operativas. Dadas estas perspectivas, Martelli expuso una serie de retos y cuestionamientos que abarcan los distintos aspectos que involucra un acercamiento a Big Data; estas preguntas pueden ser muy útiles antes de emprender cualquier inversión en la herramienta: Retos Tecnológicos 6 Tema Reto principal Preguntas relevantes Escalabilidad Flexibilidad de la infraestructura para interactuar con un alto volumen de datos, usando una variedad de formatos. Costo y esfuerzo asociado a la escalabilidad. ¿Qué niveles de disponibilidad y confiabilidad son posibles en las operaciones críticas con grandes volúmenes de datos? ¿Quién puede proveerle la mejor escalabilidad y almacenaje, en tiempo real? ¿Está justificada la inversión para formar una infraestructura adecuada para administrar Big Data? Integración El incremento de la complejidad, variedad y volumen de datos da como resultado un aumento de la inversión de tiempo y dinero para saltar las brechas de cumplimiento, administración y apalancamiento de datos, entre múltiples plataformas y sistemas. Implicación de estándares y maestría en la administración de datos. Con el incremento en el volumen de datos, ¿cuál es la mejor infraestructura y estrategia de integración para responder a las crecientes demandas de volumen y velocidad de procesamiento? ¿Cómo se pueden integrar los datos no estructurados junto al resto de los datos almacenados en sistemas tradicionales? Despliegue Identificación de las mejores soluciones en software y hardware; selección de la mejor infraestructura. Cambiar los sistemas preexistentes por nueva tecnología. Con el incremento de la complejidad del ambiente, ¿cómo desarrollaremos una estrategia para la integración y el despliegue? Debido al grado de especialización de proceso, ¿es el Cloud Computing una plataforma adecuada? Y si lo es, ¿qué variante es la que se necesita (privada, pública, híbrida)? Analytics Gasto considerable de tiempo y dinero para crear algoritmos que escalen al volumen de Big Data y que mejoren la experiencia y opciones del usuario. Con tanta profusión de datos, ¿cuáles son las preguntas adecuadas para obtener un entendimiento que agregue valor a la empresa y a nuestros clientes? ¿Cómo podemos ajustar la experiencia de los usuarios para obtener conocimiento a través de Analytics? ¿Cómo pueden comprender los tomadores de decisión los resultados de los análisis, para ejecutar rápidamente acciones? Retos de calidad de dato Tema Reto principal Preguntas relevantes Calidad de dato Calidad comprometida, debido al volumen y variedad de los datos. Costos de mantenimiento de la calidad del dato: validez, integridad, consistencia, relevancia, completitud y exactitud. ¿Qué datos se deben conservar y cuáles serán los criterios de calidad? ¿Cómo vamos a asegurar la calidad de los datos no estructurados? ¿Cómo vamos a medir la calidad de la extracción y procesos usados para Big Data? Gobernanza Identificar los requisitos para la protección de los datos y desarrollar una apropiada estrategia de gobernanza. Reevaluación de las políticas de datos internas y externas, así como de las regulaciones. ¿Qué tipo de gobierno es apropiado en un escenario cambiante respecto a los datos? ¿Qué licencias y propiedad intelectual aplican cuando un ambiente de Big Data atraviese toda la organización, incluso, globalmente? ¿Cómo deben interpretarse el ciclo de vida del dato en un contexto de Big Data? Privacidad Temas de privacidad, relacionados directa o indirectamente con el uso de Big Data. Mayores implicaciones en los temas de seguridad. ¿Cómo planea cumplir su compañía con la protección de datos personales? Si usa un hospedaje externo, ¿qué garantías le ofrecen para mantener la privacidad de su información? ¿Qué aspectos de seguridad y privacidad influirán en el diseño de un ambiente de Big Data, a fin de reducir la vulnerabilidad ante riesgos internos y externos? Retos de Talento Tema Reto principal Preguntas relevantes Talento Identificar y adquirir el skill set requerido para entender y apalancar Big Data. ¿Tiene su organización el skill set necesario para apalancar Big Data? CIO Roundtable ¿Está lista su organización para aprovechar el potencial que ofrece Big Data? 7 Roadmap para una adecuada implementación Para llevar estos conceptos a la acción, Martelli explicó a los asistentes que el camino hacia una implementación exitosa comienza con un cuestionamiento por parte de los tomadores de decisiones y luego, se procede a definir las fuentes de datos y las tecnologías que se requieren para hacer frente a las necesidades. pueden proporcionar información que puede ser aprovechada. El análisis y la evaluación de las capacidades actuales pueden proporcionar información sobre las herramientas que se pueden integrar con tecnologías más apropiadas para manejar Big Data. Paso 3. Identificar y definir los casos de uso. El experto sugirió un roadmap a seguir para implementar adecuadamente cualquier iniciativa relacionada con Big Data. Con base en las evaluaciones y las prioridades de negocio identificar y priorizar grandes casos de uso de datos, es decir, ¿en qué contexto y para qué propósito vamos a utilizar la información recabada? Paso 1. Identificar oportunidades. Paso 4. Implementar pilotos y prototipos. La identificación de oportunidades estratégicas comienza con las preguntas hacia las cuestiones críticas de la implementación (tal como se mostró en el capítulo anterior). Este proceso es independiente de los datos subyacentes (volumen, variedad y velocidad) y por lo tanto, es aplicable tanto a datos tradicionales y estructurados como a grandes volúmenes no estructurados. Identificar las herramientas, tecnologías y procesos que podemos utilizar para los casos de uso ya identificados, y a continuación, implementar pilotos y prototipos. Mucho tiempo y dinero se puede ahorrar mediante la adopción de un usuario de negocios que esté impulsado por un piloto o prototipo, que se enfoque en iniciativas que proporcionen valor al negocio. Paso 5. Adoptar estrategias en la producción. Paso 2. Evaluación de las capacidades actuales. La evaluación de las capacidades actuales es crucial para identificar el alcance y los requisitos para las iniciativas de Big Data. Los datos y la evaluación de la aplicación 8 Una vez identificadas y comprobadas, priorizar e implementar las iniciativas que hayan resultado ser exitosas en la pruebas y hayan demostrado ofrecer un alto valor en la producción. Insights del panel de expertos En esta ocasión el CIO Roundtable tuvo el privilegio de contar en su panel de discusión con dos importantes directivos de tecnología, de empresa pública y privada respectivamente. Algunos de los puntos de vista más relevantes que expresaron los expertos fueron los siguientes: ¿A qué tipo de volúmenes de datos se enfrentan ustedes? • En industrias como retail, el nivel de detalle es sumamente importante. Se guarda información de todos los tickets de las tiendas a nivel global, se hace el análisis de toda la canasta de nuestros consumidores, toda la información de punto de venta de todos los países; más la información de back office, financiera y de recursos humanos, se guarda información sobre los hábitos de los consumidores, analizando las redes sociales y las plataformas de e-commerce. • En el sector público, la información de diversas bases de datos pueden ayudar a tener una mejor seguridad y control en diversos trámites y servicios, pero se necesitan cambiar paradigmas, hacer análisis de bases cruzadas, integrar datos con información relevante a nivel nacional; es en estos requerimientos cuando se ven la áreas de oportunidad: problemas de hardware, performance inadecuado, etc. ¿Cómo va a trasformar Big Data a los negocios? • Big Data no es algo nuevo para las empresas que están acostumbradas a manejar grandes volúmenes de información, sin embargo el tener muchos datos, no significa entenderlos ni saberlos utilizar o que estemos tomando las mejores decisiones. • Las organizaciones estaban acostumbradas a manejar la información en silos, de forma más aislada, el reto ahora es cómo usar esta información de forma que tenga mucho más sentido y que sea multifuncional. • Conectar la necesidad del cliente con la productividad interna dependerá de que pensemos diferente, le demos sentido y logremos hacer relaciones entre los datos, para esto se requerirá de nuevo talento que sepa cómo utilizar e interpretar estas nuevas herramientas, por lo que no es sólo un tema tecnológico sino también de talento estratégico. • Para hacer una administración adecuada de datos que gestionen información de distintas fuentes, es necesario determinar algoritmos y patrones de riesgo, para lograr echar adelante un modelo se procesan más de 1000 millones de registros. Aquí entra un tema de equilibrio, porque a veces si el modelo era el correcto, el software no era el indicado y si el performance era aceptable, no llegaba a ser lo óptimo. CIO Roundtable ¿Está lista su organización para aprovechar el potencial que ofrece Big Data? 9 Opinión de los asistentes Finalmente, se les pidió a los asistentes que expresaran sus opiniones sobre el tema. Estas fueron algunas de sus conclusiones: • Big Data no sólo se refiere a la información que se produce al interior de la empresa, sino que su alcance va más allá, no todos necesitan un nivel de detalle tan profundo, pero varias empresas, según las necesidades de su industria, requieren ese nivel de información. Big Data no es solo un tema de volumen de información, sino también de tiempo de respuesta, para que se pueda traducir en una ventaja competitiva. • La cuestión del talento debe realizarse por medio de la colaboración entre las distintas áreas del negocio, como gente de ventas y mercadotecnia trabajando en conjunto con el área de tecnología, que pueden darle más sentido a los datos recabados. Se trata de saber qué extraer y para qué. • Uno de los temas prioritarios es la seguridad de la información: quién es el dueño y cómo se maneja éticamente; también es importante saber qué información extraer; si no se decide correctamente, se corre el peligro de perder el objetivo. 10 • El reto más importante son los datos no estructurados más allá de la empresa, pero primero habría que pensar si ya se usan correctamente los datos estructurados, asimismo, se debe tener bien claro los alcances de la estrategia para tener un ROI adecuado, ver si no es un costo demasiado alto, cuál es límite de lo que se busca analizar. • Antes de pensar en un proyecto de Big Data, tendríamos que pensar si lo que tenemos de infraestructura tecnológica es suficiente y cuál es la calidad de datos que buscamos, esto debe ir antes de cualquier proyecto, porque corremos el riesgo de tener una gran inversión tecnológica, con una información que no cumpla con las expectativas de lo requerido. • Más que el almacenamiento de la información, el gran reto es cómo explotar la herramienta, cómo hacerle las preguntas correctas a ese “gran oráculo” y luego qué hacer para cuándo nos responda, puesto que la información que no genera acciones, no sirve para nada. • En cuanto al tema de privacidad, la sociedad podría reaccionar y reclamar sus patrones de consumo y comportamiento como parte de su información privada, hoy existe la protección de datos, pero sólo los datos directos, por lo que tenemos que estar preparados para reaccionar ante este tipo demandas de los consumidores. Conclusiones Big Data sin duda es una oportunidad histórica para transformar los negocios. Dentro de muy poco tiempo todas las industrias sufrirán los impactos de esta creciente avalancha de datos que esperan ser gestionados. Esta nueva realidad requerirá capacidades tecnológicas y humanas que aún estamos descubriendo y que impondrán nuevos retos a las organizaciones. Muchas compañías están entrando en acción utilizando recursos que ya tienen. Están trabajando en paralelo con las inversiones relacionadas en administración de la información, inteligencia de negocios, minería de datos y análisis tradicionales. Pero antes de cualquier acción, deténgase y piense en lo que su organización necesita. Big Data significa algo diferente con diversos niveles de valor, para diferentes organizaciones. Para algunas compañías, Big Data puede ser un componente importante o central de su estrategia. Para otros podría ser una distracción muy cara. Pero, ¿realmente ayudará a su compañía? No olvidemos que en última instancia, se trata de tomar mejores decisiones de negocio. Lo invitamos a conocer con mayor profundidad este tema, contactando a los expertos de Deloitte. Contacto: Omar Camacho Socio Consultoría Responsable de Clientes y Mercados Tel. +52 (55) 5080 7081 ocamacho@deloittemx.com Juan Pinacho Socio Consultoría Responsable de la línea de servicio de TI Tel. +52 (55) 5080 7121 jupinacho@deloittemx.com Lina Hernández Directora Consultoría CIO Roundtable Tel. +52 (55) 5080 6233 linhernandez@deloittemx.com www.deloitte.com/mx Deloitte se refiere a Deloitte Touche Tohmatsu Limited, sociedad privada de responsabilidad limitada en el Reino Unido, y a su red de firmas miembro, cada una de ellas como una entidad legal única e independiente. Conozca en www.deloitte.com/mx/conozcanos la descripción detallada de la estructura legal de Deloitte Touche Tohmatsu Limited y sus firmas miembro. Deloitte presta servicios profesionales de auditoría, impuestos, consultoría y asesoría financiera, a clientes públicos y privados de diversas industrias. Con una red global de firmas miembro en más de 150 países, Deloitte brinda capacidades de clase mundial y servicio de alta calidad a sus clientes, aportando la experiencia necesaria para hacer frente a los retos más complejos de los negocios Cuenta con alrededor de 200,000 profesionales, todos comprometidos a ser el modelo de excelencia. Tal y como se usa en este documento, “Deloitte” significa Deloitte Consulting Group, S.C., la cual tiene el derecho legal exclusivo de involucrarse en, y limita sus negocios a, la prestación de servicios de consultoría (incluidos tecnología de la información, estrategia y operaciones y capital humano) en México bajo el nombre de “Deloitte”. Esta publicación sólo contiene información general y ni Deloitte Touche Tohmatsu Limited, ni sus firmas miembro, ni ninguna de sus respectivas afiliadas (en conjunto la “Red Deloitte”), presta asesoría o servicios por medio de esta publicación. Antes de tomar cualquier decisión o medida que pueda afectar sus finanzas o negocio, debe consultar a un asesor profesional calificado. Ninguna entidad de la Red Deloitte, será responsable de pérdidas que pudiera sufrir cualquier persona o entidad que consulte esta publicación. © 2013 Deloitte Consulting Group, S.C.