BIG DATA RESEÑA HISTÓRICA Docente: José Carlos Navarro Vega E-mail: jcnavarro@unamad.edu.pe Ingeniería de Sistemas e Informática 1956 1962 Memoria Virtual (Fritz-Rudolf Güntsch) Reconocimiento de Voz (William C. Dersch) Diseña un método para almacenar datos, base de los sistemas modernos. Presenta "Shoebox" la primera máquina en comprender 16 palabras y 10 dígitos en inglés hablado mediante el uso de los datos disponibles en ese momento, y la capacidad de procesarlo de manera eficiente. Concepto desarrollado por este físico alemán como una idea que trataba el almacenamiento finito como infinito y permitía procesar datos sin importar la limitación de memoria del hardware. Ingeniería de Sistemas e Informática 1966 Sistemas de computación centralizados (La Era de la Automatización ) También se encontraba en auge el sector de los negocios. Debido a la afluencia de información en los años 60, las organizaciones comienzan a diseñar, desarrollar e implementar sistemas de computación centralizados que les permiten automatizar sus sistemas de inventario. 1975 El auge de la comunicación bidireccional El censo de flujo de información de Japón, comenzó a rastrear el volumen de información. Con el número de palabras utilizadas como unidad de medida en los medios, concluyó que la demanda de comunicación unidireccional se había estancado. Sin embargo, aumentaba la demanda de comunicación bidireccional y más personalizada. Ingeniería de Sistemas e Informática 1989 1989 La fundación de World Wide Web (Tim Berners-Lee) Primer articulo de Big Data (Erik Larson) Nace internet, cualquier persona puede estar en online, carga datos y descarga datos. El artículo habla sobre organizaciones que recopilan, se unen y extraen datos de millones de personas para usar con fines de marketing. La web fue concebida y desarrollada originalmente para satisfacer la demanda de intercambio automatizado de información entre científicos de universidades e institutos de todo el mundo. Ingeniería de Sistemas e Informática 1992 1995 El primer informe de Base de Datos La World Wide Web explota Crystal Reports crea la primera base de datos simple con Windows, lo que facilita a las empresas el trabajo. De esta forma, comprar más memoria incentiva el uso de técnicas de programación que usan la memoria de forma más masiva. La década de 1990 fue un momento de crecimiento explosivo para la tecnología y los datos de Business Intelelligence comenzaron a acumularse en forma de documentos de Microsoft Excel. Ingeniería de Sistemas e Informática 1996 1997 Precio del almacenamiento de datos Google lanza su motor de búsqueda Los precios empiezan a ser accesibles con un coste eficiente en lo que es una de las grandes revoluciones en la historia del big data. El libro La evolución de los sistemas de almacenamiento, de 2003, establece esta fecha como el primer año en que el almacenamiento digital es más barato que el papel. Los siguientes años será de largo el primer lugar al que acudir en busca de datos en internet. Este mismo año, se publica el estudio ¿Cuánta información hay en el mundo?, de Michael Lesk. La conclusión es que hay tanta y crece a tal velocidad, que gran parte de ella no será vista por nadie jamás. Ingeniería de Sistemas e Informática 2001 Las tres V de Big Data de Gartner (Doug Laney) Las 3Vs de Big data fue definido por Doug Laney en el año 2001, donde describe la gestión de los datos en 3 dimensiones. Las 3Vs son Volumen, Velocidad y Variedad. 2003 Google publica GFS y MAPREDUCE Google publica en 2003 y 2004 las publicaciones de GFS (Google File System) y MapReduce que son los dos pilares fundamentales de Hadoop y de las tecnologías Big Data, que en 2006 incluyó Yahoo! en Hadoop. Ingeniería de Sistemas e Informática 2006 2009 Hadoop: código abierto para Big Data Cloudera aparece en el mercado Sistema de código 100% abierto para almacenar, procesar y analizar grandes volúmenes de datos. Entran en escena empresas que gestionan datos lo que permite a las empresas reunirlos en un lugar centralizado, seguro y completamente administrado. Ingeniería de Sistemas e Informática 2011 2012 Lanzamiento de Hortonworks Big Data en campañas políticas Competidor de Cloudera, líder de plataformas de datos abiertas y conectadas permite acumular, analizar y actuar sobre la información derivada de los datos y es 100% de código abierto. Fue Obama en 2012 el primer candidato a unas elecciones presidenciales que utilizó una combinación de la base de datos analíticos HP Vertica MPP con modelos predictivos, con la finalidad de obtener un mayor margen de competencia frente a sus rivales. Ingeniería de Sistemas e Informática 2013 2014 250 libros sobre Big Data en Amazon Uso de internet móvil Aumenta el interés de este tema y por ende el número de libros sobre Big Data. Los móviles superan a los ordenadores en accesos a internet. La conexión casi continua contribuye a generar muchos más datos y mejora la conectividad con otros dispositivos. Ingeniería de Sistemas e Informática 2014 2015 El año de Internet de Las cosas Smart Cities y Los datos Según Gartner, había 3.700 millones de "cosas" conectadas en uso en 2014. Gartner estima que más de 1.100 millones de "cosas" conectadas serán utilizadas por ciudades inteligentes en 2015, incluida la iluminación LED inteligente, monitoreo de atención médica, cerraduras inteligentes y redes de sensores para "cosas" como detección de movimiento o control de la calidad del aire. Ingeniería de Sistemas e Informática 2020 EL futuro del Big Data Los expertos ahora apuntan a un aumento estimado del 4300% en la generación anual de datos para el año 2020. Los factores impulsores incluyen el cambio de las tecnologías analógicas a digitales y el rápido aumento en la generación de datos por parte de individuos y empresas por igual.