TEMARIO Capítulo 1 Intro a Big Data IntroHadoop y BD NoSQL

Anuncio
TEMARIO
Capítulo 1
Intro a Big Data
IntroHadoop y BD NoSQL
Stack de Hadoop por dentro
Capítulo 2
Hadoop HDFS Almacenamiento
de Datos Distribución y
particionamiento
FaultTolerance
Arquitectura
Comandos en HDFS
Capítulo 3
HadoopHue
Introducción y conceptos
File Browser
Acciones sobre Archivos y Directorios
Job Browser
Job Designer
Workflow Editor
Query Editor
Data Browser
Capítulo 4
Conceptos de Map/Reduce
HadoopHive
Instrucción de Definición de Datos
Tipos de Datos
Tipos de Archivos
Instrucciones de Manipulación de Datos
Capítulo 5
Hadoop – Oozie
Configurar un workflowOozie
Hadoop – Sqoop
Usar Sqoop para transferir datos entre Hadoop y una base de datos
Hadoop – Flume
Usar Flume para tomar datos de streaming en HDFS.
Capítulo 6
Intro a BD NoSQLColumnFamily
Hadoop - Hbase
Capítulo 7
Monitoreo y Operación con Hadoop - Ambari
Capítulo 8
Arquitectura de Hadooop
Apache Zookeeper
Yarn 2
Capítulo 9
Seguridad en Hadoop
Capítulo 10
Otras distribuciones
Características principales
CRONOGRAMA
Clase
Tema
1
Intro a Big Data
IntroHadoop y BD NoSQL
Stack de Hadoop por dentro
2
Hadoop HDFS
Almacenamiento de Datos
HDFS Comandos
Práctica HDFS introductoria
3
Distribución y particionamiento
FaultTolerance
Arquitectura introductoria
HDFS Comandos Continuación
Práctica HDFS Continuación
4
HadoopHue
Introducción y conceptos / File Browser
Acciones sobre Archivos y Directorios / Job Browser
Job Designer / Workflow Editor / Query Editor / Data Browser
Práctica con Hue
5
Concepto de Map/Reduce
HadoopHive
HadoopHueQuery Editor repaso
Consola Modo Caractér
Sentencias de Definición de datos
Tipos de Archivos
Introducción a manipulación de Datos
Práctica con HIVE Definición e intro a manipulación de datos.
Ver con Job Browser procesos map reduce lanzados a través de nuestra
consulta.
CREATE ALTER DROP DATABASE CREATE ALTER DROP TABLE LOAD DATA
INSERT
6
Map/Reduce repaso
HadoopHive repaso
HUE Job Browser repaso
Sentencias de manipulación de datos Avanzado
Práctica con Hive de Manipulación de datos avanzada
SELECT con todas sus cláusulas
7
Breve repaso de Map/Reduce
HadoopPig
Set de Instrucciones básicas de Pig
Ejemplos de programación Pig
Comparación entre Hive y Pig
Práctica de ejercicios en Pig
8
Intro a Apache Sqoop
Importación y exportación de datos entre Hadoop y BD Relacionales
Intro a Apache Oozie
Armado de workflow de procesos básico
Practica de sqoop y oozzie
9
Apache Flume
Apache Hbase - NoSqlColumnFamilyDatabase
Práctica con Flume y Hbase.
10
Apache Ambari
Monitoreo y Operación
Práctica con Ambari
11
Arquitectura
Alta / Baja de Nodos
Configuración del cluster
Alta Disponibilidad
Práctica de Operación de Hadoop
Arquitectura LAMBDA
Otros componentes arquitecturales
spark (Motor de procesamiento)
tez (Motor de procesamiento)
kafka
storm (Motor de procesamiento)
12
Guía de instalación de Hadoop
Otras Distribuciones
Características principales
Seguridad en Apache Hadoop
Práctica de Seguridad en Apache Hadoop
Descargar