Reflexiones y Conclusiones recabadas en el Seminario Internacional: Big-Data para la Información Oficial y la Toma de Decisiones El trabajo sobre el análisis de grandes cantidades de información estadística que actualmente realizan las oficinas nacionales de estadística ya no es una opción. Ahora es necesario involucrar Big Data en los procesos de generación y procesamiento de la información, ya que ofrece una oportunidad para almacenar y analizar cantidades muy grandes de información de forma rápida y de fácil acceso. Esto ayudará a mejorar el tiempo en el que se genera la información, sin descuidar su calidad y relevancia. Pero además, es importante para construir decisiones y políticas basadas en evidencias. Se debe ser creativo y de mentalidad abierta en el uso de Big Data. La meta última es servir al gobierno, a la sociedad civil, al sector privado, la academia y al público en general, con un mejor producto. Las personas esperan recibir información confiable y precisa sobre los hechos y conocimiento de las oficinas nacionales de estadística. Para lograrlo, es necesario trabajar conjuntamente con varios sectores de la sociedad, a escalas nacional, regional e internacional, generando alianzas con los diferentes grupos (academia, sector privado organizaciones). Big-Data es aceptado entre la comunidad estadística como algo que va a permanecer y que se tendrá que trabajar en el futuro, innovando con la organización de la información. Es necesaria una homologación normativa y conceptual en torno a diversos temas y aspectos relacionados con internet y, por tanto, con Big Data y sus herramientas a nivel federal, ya que existen definiciones disímbolas en las distintas regulaciones. El uso de la información de los usuarios en el contexto de Big Data, debe respetar los derechos a la privacidad e intimidad de las personas y debe estar protegida sin perder el equilibrio con la libertad de expresión y el derecho a la información. La anonimización de la información y el Aviso de Privacidad son dos elementos útiles y regulados en México, para proteger los datos personales. En la actividad estadística y la generación de información oficial, ambos son sumamente importantes. Por lo que, se debe garantizar su observancia cuando se use Big Data. No obstante, la protección de la privacidad no debe ser un límite para el aprovechamiento de las oportunidades que brinda Big Data y debe estar en equilibrio con respecto al denominado Open Data. 1 Existe la necesidad de regular algunos aspectos de Big Data, pero sin llegar a una sobrerregulación que obstaculice su potencial y que sea acorde con las políticas nacionales de e-government. La creación de normas sobre Big Data debe considerar el punto de vista técnico y adoptar un enfoque interdisciplinario. Las estrategias y la regulación que pretendan llevarse a cabo, no deben descuidar la atención a las líneas y políticas de la gobernanza en Internet. En el ámbito comercial, Big Data permite conocer mejor al usuario y crear perfiles, pero no deben descuidarse las obligaciones que impone la Ley Federal de Protección de Datos Personales en Posesión de los Particulares, la futura Ley de Transparencia y la Ley Federal de Protección al Consumidor. Es importante incorporar Big Data Streaming para monitorear fenómenos naturales y tomar decisiones oportunas en beneficio de la ciudadanía. Se deben aprovechar las herramientas de cómputo de alto desempeño y minería de datos para cuantificar y optimizar la explotación de recursos naturales, como los yacimientos de hidrocarburos. Las redes sociales (Twitter, Facebook, etc.) son una fuente de información disponible y plausible para estudiar aspectos sobre la ciudadanía tales como: análisis de opinión, estados de ánimo, percepción de seguridad, etc. No basta con tener una política de datos abiertos que se utilizan para la transparencia y el cumplimiento de la información. Se deberían ofrecer oportunidades para detonar la innovación y complementar las capacidades de los organismos públicos, para que sean proveedoras de información de calidad y con oportunidad. No es suficiente contar con las plataformas de datos abiertos. Hay que incorporar Application Programming Interface que permita interactuar sistemáticamente con estas plataformas. Hay que trabajar en la formación de recursos humanos altamente especializados generando un perfil de científico de datos. 2 Existe mucha teoría sobre la Topología de Análisis de Datos (TDA). Por lo que, es necesario desarrollar metodologías para generar Big Data. Con la TDA se pueden desarrollar herramientas para estudiar las características cualitativas de los datos y es muy flexible para lograr aplicaciones a diversas bases de datos. Mapper es la forma más exitosa para las aplicaciones de series de datos. Es necesario trascender hacia enfoques multidisciplinarios e interdisciplinarios, es claro que para este tema se requiere de grupos de especialistas de diversas formaciones. Un ejemplo son los profesionales que está formando el ITAM. Pero además, se debe tener claridad de que, además de tener Big-Data, se deben tener “Big-questions” o sea, preguntas que puedan ser relevantes y puedan ser contestadas a través de Big-Data. En complemento con estos esfuerzos, el Centro GEO está trabajando tanto con INFOTEC como con el CIDE para incorporar el componente de geo-inteligencia territorial, estos son temas que están muy vigentes, muy vivos. 3