U N ZE T TABY TE D E M OTI VO S PAR A HABL AR D E DATO S Y D E S AR RO LLO Septiembre de 2015 Bogotá D.C., Colombia Datos en todas partes Datos sobre los datos Acordado el texto de la Agenda Global 2030, la atención se mueve de la negociación política de prioridades para el Desarrollo Sostenible hacia los desafíos de implementación de los compromisos asumidos por los países en el seno de las Naciones Unidas. De acuerdo con IBM el 90% de todos los datos que generan dispositivos como smartphones, tabletas, vehículos y electrodomésticos conectados nunca se analiza. ¿Es eso un problema realmente? ¿Qué información relevante estamos perdiendo? A pesar de las muchas opciones que plantea este escenario parece existir un cruce de caminos ineludible: la importancia de los datos. “dato” tiene su origen en el vocablo latino “datum”, lo dado. Originalmente expresaba precisamente lo que los objetos dan a quienes los estudian pero, como sostuvo Jensen ya en 1950, esto refleja un “desafortunado accidente 1 de la historia” en tanto los datos no son dados por los objetos sino que son tomados de ellos por alguien que los investiga. Lejos de referir a una situación pasiva requieren de un compromiso activo con ellos. No se trata de un tema estrictamente nuevo: el uso de datos y estadísticas ha acompañado a los debates sobre desarrollo desde sus inicios. Lo realmente novedoso es la forma en que hoy somos capaces de relacionarnos con los datos. Lejos de ser algo ajeno o extraño, propio del campo del estudio científico, los datos son hoy la realidad cotidiana de millones de personas alrededor del mundo que se conectan a internet, hablan desde sus teléfonos móviles, siguen una u otra ruta de regreso de casa al trabajo. Señalar esto es de particular importancia hoy, cuando los datos parecen generarse solos y por todas partes. No es así. Todos ellos tienen un origen detectable y solo se vuelven de valor cuando son activamente apropiados y puestos en función. En cierta forma podría decirse hoy que “somos datos”, una afirmación que puede resultar incómoda en tanto expone los riesgos asociados a nuestra realidad cotidiana. El Data Deluge (avalancha de datos) de que nos 2 hablaba The Economist es en realidad un Data Ocean (océano de datos) en el cual sumergirnos. Se trata, vale aclararlo, de un océano muy amplio: según se estima, solo en el año 2013 la población mundial ha generado entre 4 y 5 Zettabytes de información. Para entender lo que eso significa podemos pensar que, según lo estima Cisco, en 2016 toda la red de internet entre 1984 y 2015 puede almacenarse en 1.3 Zettabytes. La denominada (R) evolución de Datos está aquí y ha llegado para quedarse. Como toda herramienta no es buena ni mala sino que asumirá el carácter que se otorgue a su uso, la particularidad que tiene es que una de las vías para asegurar el control sobre su utilización es abrirla tanto como sea posible. 1 Ver Conceptualising Data, Pág. 2. 2 The Data Deluge, artículo publicado en The Economist, Febrero 25, 2010. www.cepei.org 2 Del Megabyte al Zettabyte 1000 1GB 1000 1PB MEGABYTES TERABYTES 1000 1TB 1000 1EB GYGABYTES PETABYTES 1000 1 ZETTABYTE (1ZB) EXABYTES Fuente: Elaborado por CEPEI con base en: The Dawn of the Zettabyte Era 3 Se trata mucho más de una posibilidad que de una amenaza, tal como resulta de la afirmación que hace el Grupo Asesor de Expertos Independientes del Secretario General sobre la Revolución de los Datos para el Desarrollo Sostenible en su informe Un mundo que cuenta. Movilización de la revolución de los datos para el Desarrollo Sostenible, cuando sostiene que “los datos son el alma del proceso de adopción de decisiones y la materia prima para la rendición de cuentas”. ¿Alguien cree posible avanzar hacia mejores niveles de desarrollo decidiendo políticas sociales en una ruleta? miseria, del hambre, entre otros) necesita de datos y de personas preparadas para comprender y procesar una cantidad cada vez mayor de ellos. El desafío es enorme y abre la necesidad de una “alfabetización de datos” que permita operar con ellos no solo a los expertos y científicos de datos sino a la población en general. ¿Quién sino el conjunto de las personas debería poder comprender y analizar las rendiciones de cuentas que los datos habilitan? La (R) evolución de Datos no cambiará al mundo por sí sola, pero la construcción de un mundo en que las personas puedan vivir en libertad (del miedo, de la 3 Publicado por Thomas Barnett, Jr. 2011. 3 Un Zettabyte de motivos para hablar de datos y desarrollo ¿Big Data? ¡Data Revolution! Para estos Zettabytes de información, tenemos un término más sencillo: Big Data (Macrodatos). Este término ha sido definido de maneras diferentes para referirlo tanto al cada vez mayor volumen de información que generamos las personas a través del uso de tecnologías digitales, a las nuevas tecnologías y métodos hoy disponibles para analizar conjuntos enormes de datos que originalmente no fueron elaborados para su análisis y a la capacidad disponible para convertir cantidades gigantes de datos en información que pueda utilizarse para la formulación de políticas orientadas hacia el Desarrollo Sostenible. Volumen de los Datos Velocidad de producción y gestión 3V Una perspectiva particularmente atractiva para nosotros es la de entender el Big Data como “la capacidad de la sociedad de aprovechar la información de formas novedosas, para obtener percepciones útiles o bienes 4 y servicios de valor significativo” . A través de las posibilidades que se abren con el Big Data es posible desde mejorar tratamientos médicos hasta establecer estrategias exitosas para equipos de fútbol, definir los mejores momentos para comparar alimentos ahorrando dinero o aumentar los niveles de seguridad de mecanismos antirrobos; pero lo que es más trascendental aquí es que permite también mejorar la salud, el cuidado del medio ambiente, reducir el hambre y aumentar los niveles de seguridad a escala social. Cualquier parecido con la Agenda 2030 no es mera casualidad sino demostración de la importancia que pueden llegar a tener los datos para que seamos exitosos en su implementación. Variedad de los Datos Visión clásica del Big Data Por otro lado, el ya mencionado informe Un mundo que cuenta hizo popular la referencia más breve a la (R) evolución de Datos cuyo sentido se comprende mejor reemplazando las “Tres V” por las “Tres C” de crumbs (migajas, en inglés), capacidades y comunidades. La visión clásica sobre el Big Data estaba dada en las TresV, tal como se muestra a continuación: 4 tal como los proponen Viktor Mayer-Schönberger y Kenneth Cukier en su libro Big Data, la revolución de los datos masivos. www.cepei.org 4 Las 3C: nuevo enfoque sobre Big Data y (R) evolución de Datos Migajas de información Rastros digitales que vamos dejando con nuestras actividades y que asumen la forma de datos estructurados y listos para su procesamiento Capacidades Herramientas y métodos para tratar con los datos Comunidad Inclusión de actores individuales e institucionales que tradicionalmente han estado al margen de las esferas de la toma de decisiones y la investigación y hoy hacen parte del equipo de la (R) evolución de Datos, entre ellos cada uno de nosotros con nuestras actividades diarias. Fuente: Emmanuel Letouzé, Big Data and Development. An overview De esta manera el concepto de (R) evolución de Datos es más amplio que el de Big Data por la consideración de más variables en su definición5: “La revolución de los datos es una explosión en el volumen de datos, la velocidad con que se producen los datos, el número de productores de datos, la difusión de los datos y la gama de cosas en las que se encuentran datos”. El concepto de (R) evolución de Datos tiene la ventaja de volver a dar a las personas un rol protagónico no solo como usuarios de datos, sino como sus hacedores, en el sentido que dábamos a los datos al comienzo de este trabajo, no como algo dado por el objeto sino como algo intencionalmente tomado a partir de él en una actitud proactiva de descubrimiento. LOS MOTORES DE LAS REVOLUCIÓN DE DATOS GOBIERNO ABIERTO 0000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000 0000000000000000000000000000000000 MEGAS DATOS ACCIÓN CUIDADANA Fuente: Elaboración CEPEI 5 Tal como aparece en The data revolution. Finding the missing millions, documento elaborado por ODI, 2015. 5 Un Zettabyte de motivos para hablar de datos y desarrollo Posdata: La humanidad de los datos • Las oficinas de estadística tienen competencia y estatus limitados a nivel nacional. El último punto señalado es de la mayor importancia: la (R) evolución de Datos es, ante todo, una evolución en y desde las personas que se apropian de ellos y los utilizan asignándoles valor social y finalidades, combinándolos para convertirlos en información y utilizando esa información para lograr ciertos fines. • Los datos no se divulgan ni se usan adecuadamente • El potencial de las Tecnologías de la Información y las Comunicaciones no se ha aprovechado al máximo • El diseño y gestión de procesos estadísticos son insuficientes. “La información es poder”, se repite hoy como un mantra, pero eso es cierto solo en la medida en que las personas pueden acceder a ella, comprenderla y utilizarla. Empoderar a las personas en tiempos de la (R) evolución de Datos y el Big Data implica trabajar en una alfabetización de datos que evite la aparición de una nueva división: la brecha de datos. Los datos ya son parte del desarrollo no solo como base para la toma de decisiones sino en sí mismos, como factores de promoción de las capacidades y libertades humanas. • La ayuda técnica y económica no está correctamente adaptada a las prioridades nacionales • Los países pagan un coste muy elevado por la gestión de la ayuda al desarrollo • La coordinación global de los sistemas nacionales de estadística es problemática. Tal como lo afirma la naciente Alianza de Datos para el Desarrollo Sostenible, iniciativa multi-actores que tiene por objetivo movilizar y coordinar las acciones e instituciones requeridas para cerrar las brechas de información, potencializando la innovación y el compromiso con la calidad de datos, “La Agenda 2030 ofrece una oportunidad a los gobiernos y ciudadanos de revisar sus sistemas estadísticos, así como su administración y el uso de los datos para el desarrollo sostenible”. En la muy limitada mirada que impone nuestro actual interés en ella como posibilitadora de nuevas y mejores decisiones orientadas al desarrollo -y, más particularmente, a la implementación de la Agenda 2030- la nueva realidad es todavía una promesa que podrá o no ser concretada pero de ninguna forma negada: la (R) evolución de Datos ya está aquí y es tan real como el texto que usted está leyendo. Simplemente, no podremos cumplir los Objetivos de Desarrollo Sostenible (ODS) planteados en esta Agenda si no contamos con datos confiables y de calidad, y técnicas innovadoras de recolección, análisis y difusión de datos que permitan la toma de decisiones basada en evidencias reales. Hoy en día, contamos con la tecnología, el conocimiento, y el recurso humano disponible para superar estos obstáculos, fomentando así nuevas alianzas que tiendan a la colaboración y así poder explotar el potencial de cada uno de los actores involucrados no solo en la (R) evolución de Datos, sino en el Desarrollo Sostenible. El Zettabyte de motivos que tenemos para hablar de datos y desarrollo debe convertirse en un Zettabyte de acciones e iniciativas encaminadas a poner a los datos al servicio del Desarrollo Sostenible. La gigantesca cantidad de datos que hoy están disp o nible s n o se traduc e dire ct a m ente en su posibilidad de utilización ni en una excelente calidad de todos los datos. Esta situación evidencia una serie de obstáculos comunes6 : 6 Planteados por París 21 en “Guía para una Revolución de Datos dirigida por los países” www.cepei.org 6 Contacto Philipp Schönrock, Director psm@cepei.org www. .org Javier Surasky, Coordinador de Investigación y Análisis j.surasky@cepei.org