ESCUELA SUPERIOR POLITECNICA DEL LITORAL PROGRAMA DE ESTUDIOS UNIDAD ACADÉMICA: CARRERA: ESPECIALIZACIÓN: ÁREA: TIPO DE MATERIA: EJE DE FORMACIÓN: FIEC Computación Todas TEÓRICA Profesional PRÁCTICA X 1. NOMBRE DE LA ASIGNATURA CÓDIGO MATERIA Procesamiento Masivo y Escalable de Datos PRE-REQUISITOS CO-REQUISITOS EQUIVALENTE A CONVALIDA CON CRÉDITOS/HORAS/SEMANALES: TEÓRICOS 1 PRÁCTICOS 3 PROFESOR RESPONSABLE Ing. Cristina Abad Robalino 2. OBJETIVOS Objetivo General: Familiarizar a los estudiantes con técnicas de procesamiento masivo de datos, usando Hadoop como plataforma libre de procesamiento escalable y distribuido, con un enfoque teórico-práctico. Objetivos Específicos: Familiarizar a los estudiantes con modernas técnicas y métodos de procesamiento masivo de datos. PROGRAMA DE ESTUDIO: IG1002-1 ESCUELA SUPERIOR POLITECNICA DEL LITORAL PROGRAMA DE ESTUDIOS Comprender el rol y el impacto del procesamiento escalable, distribuido, y tolerate a fallos que plataformas como Hadoop permite obtener. Exponer al estudiante al uso de servicios de Cloud Computing, como el Elastic Computing Cloud (EC2) de Amazon. Adquirir la habilidad necesaria para aplicar el paradigma MapReduce a problemas reales que requieran procesamiento masivo de datos. 3. PROGRAMA RESUMIDO: 1. 2. 3. 4. 5. 6. 7. Introducción MapReduce Sistemas de archivos distribuidos Computación en la nube (cloud computing) Hadoop Otros sistemas distribuidos Proyecto 4. PROGRAMA DETALLADO 1. Introducción (3 sesiones, 6 horas) Políticas de la materia (Sesión 1) Introducción a la programación en paralelo (Sesión 1) Paralelismo y sincronización (Sesión 1) Computación distribuida (Sesión 2) Introducción a MapReduce (Sesión 2) Taller práctico (Sesión 2) Avance 1 de proyecto (Sesión 3) 2. MapReduce (4 sesiones, 8 horas) Map/Fold en lenguajes de programación funcionales (Sesión 4) Paradigma MapReduce para procesamiento distribuido y paralelo (Sesión 5) Taller práctico (Sesión 6) Avance 2 de proyecto (Sesión 7) 3. Sistemas de archivos distribuidos (4 sesiones, 8 horas) Introducción a los sistemas de archivos distribuidos (Sesión 8) NFS y AFS (Sesión 8) Google File System (GFS) (Sesión 9) Taller práctico (Sesión 10) Avance 3 de proyecto (Sesión 11) 4. Computación en la nube (cloud computing) (3 sesiones, 6 horas) PROGRAMA DE ESTUDIO: IG1002-1 ESCUELA SUPERIOR POLITECNICA DEL LITORAL PROGRAMA DE ESTUDIOS Introducción: modelo de negocios y ejemplos (Sesión 12) Caso de estudio: Amazon Web Services (AWS) (Sesión 12) Taller práctico (Sesión 13) Avance 4 de proyecto (Sesión 14) 5. Hadoop (3 sesiones, 6 horas) Implementación (Sesión 15) API (Sesión 16) Taller práctico (Sesión 17) Avance 5 de proyecto (Sesión 18) 6. Otros sistemas distribuidos (4 sesiones, 8 horas) DNS (Sesión 19) BOINC (Sesión 19) PlanetLab (Sesión 20) OLPC (Sesión 20) Taller práctico (Sesión 21) Avance 6 de proyecto (Sesión 22) 7. Proyecto Revisión de fundamentos teóricos (Sesión 23) Revisión de decisiones de diseño (Sesión 24) Revisión de características de seguridad (Sesión 25) Revisión de implementación (Sesión 26) Revisión de presentaciones para sustentación (Sesión 27) Revisión de documentación (Sesión 28) 5. TEXTO GUÍA Hadoop: The Definitive Guide: Rough Cuts Version By Tom White Rough Cuts Release: September 2008 Print Book Release: July 2009 Pages: 250 ISBN 10: 0-596-52199-5 | ISBN 13: 9780596521998 6. BIBLIOGRAFÍA George Coulouris, Jean Dollimore y Tim Kindberg, “Distributed Systems: Concepts and Design”, 4ta edición. Addison-Wesley. 2005. IEEE Distributed Systems Online: http://dsonline.computer.org/ 7. VISADO PROGRAMA DE ESTUDIO: IG1002-1 ESCUELA SUPERIOR POLITECNICA DEL LITORAL PROGRAMA DE ESTUDIOS DECANO/DIRECTOR FECHA: SECRETARIO ACADÉMICO FECHA: STA FECHA: 8. VIGENCIA DEL PROGRAMA RESOLUCIÓN COMISIÓN ACADÉMICA: PROGRAMA DE ESTUDIO: IG1002-1