ESCUELA SUPERIOR POLITECNICA DEL LITORAL PROGRAMA DE ESTUDIOS

Anuncio
ESCUELA SUPERIOR POLITECNICA DEL LITORAL
PROGRAMA DE ESTUDIOS
UNIDAD ACADÉMICA:
CARRERA:
ESPECIALIZACIÓN:
ÁREA:
TIPO DE MATERIA:
EJE DE FORMACIÓN:
FIEC
Computación
Todas
TEÓRICA
Profesional
PRÁCTICA
X
1. NOMBRE DE LA ASIGNATURA
CÓDIGO
MATERIA
Procesamiento Masivo y Escalable de Datos
PRE-REQUISITOS
CO-REQUISITOS
EQUIVALENTE A
CONVALIDA CON
CRÉDITOS/HORAS/SEMANALES:
TEÓRICOS
1
PRÁCTICOS
3
PROFESOR RESPONSABLE
Ing. Cristina Abad Robalino
2. OBJETIVOS
Objetivo General:
Familiarizar a los estudiantes con técnicas de procesamiento masivo de datos,
usando Hadoop como plataforma libre de procesamiento escalable y
distribuido, con un enfoque teórico-práctico.
Objetivos Específicos:
 Familiarizar a los estudiantes con modernas técnicas y métodos de
procesamiento masivo de datos.
PROGRAMA DE ESTUDIO:
IG1002-1
ESCUELA SUPERIOR POLITECNICA DEL LITORAL
PROGRAMA DE ESTUDIOS



Comprender el rol y el impacto del procesamiento escalable, distribuido,
y tolerate a fallos que plataformas como Hadoop permite obtener.
Exponer al estudiante al uso de servicios de Cloud Computing, como el
Elastic Computing Cloud (EC2) de Amazon.
Adquirir la habilidad necesaria para aplicar el paradigma MapReduce a
problemas reales que requieran procesamiento masivo de datos.
3. PROGRAMA RESUMIDO:
1.
2.
3.
4.
5.
6.
7.
Introducción
MapReduce
Sistemas de archivos distribuidos
Computación en la nube (cloud computing)
Hadoop
Otros sistemas distribuidos
Proyecto
4. PROGRAMA DETALLADO
1. Introducción (3 sesiones, 6 horas)
 Políticas de la materia (Sesión 1)
 Introducción a la programación en paralelo (Sesión 1)
 Paralelismo y sincronización (Sesión 1)
 Computación distribuida (Sesión 2)
 Introducción a MapReduce (Sesión 2)
 Taller práctico (Sesión 2)
 Avance 1 de proyecto (Sesión 3)
2. MapReduce (4 sesiones, 8 horas)
 Map/Fold en lenguajes de programación funcionales (Sesión 4)
 Paradigma MapReduce para procesamiento distribuido y paralelo
(Sesión 5)
 Taller práctico (Sesión 6)
 Avance 2 de proyecto (Sesión 7)
3. Sistemas de archivos distribuidos (4 sesiones, 8 horas)
 Introducción a los sistemas de archivos distribuidos (Sesión 8)
 NFS y AFS (Sesión 8)
 Google File System (GFS) (Sesión 9)
 Taller práctico (Sesión 10)
 Avance 3 de proyecto (Sesión 11)
4. Computación en la nube (cloud computing) (3 sesiones, 6 horas)
PROGRAMA DE ESTUDIO:
IG1002-1
ESCUELA SUPERIOR POLITECNICA DEL LITORAL
PROGRAMA DE ESTUDIOS
 Introducción: modelo de negocios y ejemplos (Sesión 12)
 Caso de estudio: Amazon Web Services (AWS) (Sesión 12)
 Taller práctico (Sesión 13)
 Avance 4 de proyecto (Sesión 14)
5. Hadoop (3 sesiones, 6 horas)
 Implementación (Sesión 15)
 API (Sesión 16)
 Taller práctico (Sesión 17)
 Avance 5 de proyecto (Sesión 18)
6. Otros sistemas distribuidos (4 sesiones, 8 horas)
 DNS (Sesión 19)
 BOINC (Sesión 19)
 PlanetLab (Sesión 20)
 OLPC (Sesión 20)
 Taller práctico (Sesión 21)
 Avance 6 de proyecto (Sesión 22)
7. Proyecto
 Revisión de fundamentos teóricos (Sesión 23)
 Revisión de decisiones de diseño (Sesión 24)
 Revisión de características de seguridad (Sesión 25)
 Revisión de implementación (Sesión 26)
 Revisión de presentaciones para sustentación (Sesión 27)
 Revisión de documentación (Sesión 28)
5. TEXTO GUÍA
Hadoop: The Definitive Guide: Rough Cuts Version
By Tom White
Rough Cuts Release: September 2008
Print Book Release: July 2009
Pages: 250
ISBN 10: 0-596-52199-5 | ISBN 13: 9780596521998
6. BIBLIOGRAFÍA


George Coulouris, Jean Dollimore y Tim Kindberg, “Distributed Systems:
Concepts and Design”, 4ta edición. Addison-Wesley. 2005.
IEEE Distributed Systems Online: http://dsonline.computer.org/
7. VISADO
PROGRAMA DE ESTUDIO:
IG1002-1
ESCUELA SUPERIOR POLITECNICA DEL LITORAL
PROGRAMA DE ESTUDIOS
DECANO/DIRECTOR
FECHA:
SECRETARIO
ACADÉMICO
FECHA:
STA
FECHA:
8. VIGENCIA DEL PROGRAMA
RESOLUCIÓN COMISIÓN ACADÉMICA:
PROGRAMA DE ESTUDIO:
IG1002-1
Descargar