Última modificación: 20-05-2016 240AR052 - Temas Avanzados en Visión por Computador Unidad responsable: 240 - ETSEIB - Escuela Técnica Superior de Ingeniería Industrial de Barcelona Unidad que imparte: 707 - ESAII - Departamento de Ingeniería de Sistemas, Automática e Informática Industrial Curso: 2016 Titulación: MÁSTER UNIVERSITARIO EN AUTOMÁTICA Y ROBÓTICA (Plan 2012). (Unidad docente Optativa) Créditos ECTS: 4,5 Idiomas docencia: Inglés Profesorado Responsable: JUAN ARANDA LÓPEZ Metodologías docentes La metodología del curso será a través de clases magistrales de 2 h/Sesión, donde el profesor explicará la teoría e introducirá ejercicios para mejorar la comprensión de la materia. Los ejercicios consistirán en problemas expuestos y resueltos en clase (en la pizarra), o en algunos casos pueden ser códigos de programas (con la ayuda de un ordenador), así como prácticas de laboratorio. A través del curso, el alumno deberá resolver al menos 3 ejercicios específicos de los diferentes temas de la asignatura. Estos Ejercicios serán evaluados por el profesor y constituirán parte de la nota final. Habrá también un proyecto corto que será seleccionado por el estudiante, donde el estudiante debe demostrar a los conocimientos adquiridos. Este breve proyecto será presentado y evaluado en una presentación oral. Para la solución de varios de los ejercicios y el proyecto, los estudiantes utilizarán una herramienta de programación de visión por computador. Objetivos de aprendizaje de la asignatura El objetivo de la visión por computador es extraer datos de imágenes digitales. Se supone que los estudiantes han aprendido los fundamentos del diseño de técnicas de visión por computador y sus aplicaciones en la asignatura obligatoria de " Visión por Computador ". Esta assignatura complementará los conocimientos teóricos y prácticos adquiridos en Visión por Computador con temas que pueden ser considerados aplicaciones fuera del estándar o de vanguardia. La asignatura se divide en dos partes principales: En primer lugar , con énfasis en la segmentación, descripción y métodos de reconocimiento, con el fin de obtener datos simbólicos a partir de imágenes. En segundo lugar se centra en la extracción de los datos geométricos de imágenes. Los estudiantes aplicarán algunas de las técnicas que se presentan en un proyecto corto que consiste en la programación de una solución a un problema dado, donde van a demostrar sus habilidades adquiridas. Resultados del aprendizaje - Comparar las diferentes técnicas de procesamiento de imágenes y procedimientos de visión por computador . - Combinar e integrar diferentes técnicas y procedimientos. - Seleccionar las herramientas adecuadas en función del problema a resolver. - Proponer nuevos métodos o variaciones de los ya existentes. - Tomar conciencia acerca de la dificultad de aplicación de soluciones generalizadas de visión por computador. Identificar 1/8 Universitat Politècnica de Catalunya Última modificación: 20-05-2016 240AR052 - Temas Avanzados en Visión por Computador soluciones que no son aplicables a un conjunto generalizado de aplicaciones. Contenido obligatorio - Transformaciones de imágenes. - Segmentación de imagénes por la textura y color. - Descripción robusta de las regiones y las imágenes. - Visión estéreo. - Extracción y reconstrucción 3D. Horas totales de dedicación del estudiantado Dedicación total: 112h 30m Horas grupo grande: 0h 0.00% Horas grupo mediano: 27h 24.00% Horas grupo pequeño: 13h 30m 12.00% Horas actividades dirigidas: 0h 0.00% Horas aprendizaje autónomo: 72h 64.00% 2/8 Universitat Politècnica de Catalunya Última modificación: 20-05-2016 240AR052 - Temas Avanzados en Visión por Computador Contenidos 1. Introducción Dedicación: 4h Grupo grande/Teoría: 2h Aprendizaje autónomo: 2h Descripción: Este tema se ocupará de: · ¿Qué es avanzado en Visión por Computador? · Contenidos del curso, objetivos y organización Actividades vinculadas: Classe Magistral Objetivos específicos: CB1, CB2, CB3, CB4, CB5, CG1, CG3, CG8, CT2, CT3, CT4, CT5, CT7, CE7, CE9, CE13 2. Transformaciones de imagenes Dedicación: 8h Grupo grande/Teoría: 3h Grupo mediano/Prácticas: 1h Aprendizaje autónomo: 4h Descripción: Este tema se refiere a: · Fourier, DCT, Hadamard, Haar, Slant · Wavelets · Filtrado Bilateral · Aplicación de descripción de la imagen y compresión de imágenes Actividades vinculadas: Clase magistral, resolución de problemas y aprendizaje autónomo a través de ejercicios Objetivos específicos: CB1, CB2, CB3, CB4, CB5, CG1, CG3, CG8, CT2, CT3, CT4, CT5, CT7, CE7, CE9, CE13 3/8 Universitat Politècnica de Catalunya Última modificación: 20-05-2016 240AR052 - Temas Avanzados en Visión por Computador 3. Análisis de Texturas Dedicación: 8h Grupo grande/Teoría: 3h Grupo mediano/Prácticas: 1h Aprendizaje autónomo: 4h Descripción: Este tema se refiere a: · Descriptores de texturas · Métodos: Estadísticos, estructurales y sintácticos · Aplicación de segmentación de imágenes Actividades vinculadas: Clase magistral, resolución de problemas y aprendizaje autónomo a través de ejercicios Objetivos específicos: CB1, CB2, CB3, CB4, CB5, CG1, CG3, CG8, CT2, CT3, CT4, CT5, CT7, CE7, CE9, CE13 4. Análisis de color Dedicación: 8h Grupo grande/Teoría: 3h Grupo mediano/Prácticas: 1h Aprendizaje autónomo: 4h Descripción: Este tema se refiere a: · Espacios de color · Constancia del color · Descriptores para la invariancia de color · plicación de segmentación de imágenes Actividades vinculadas: Clase magistral, resolución de problemas y aprendizaje autónomo a través de ejercicios Objetivos específicos: CB1, CB2, CB3, CB4, CB5, CG1, CG3, CG8, CT2, CT3, CT4, CT5, CT7, CE7, CE9, CE13 4/8 Universitat Politècnica de Catalunya Última modificación: 20-05-2016 240AR052 - Temas Avanzados en Visión por Computador 5. Descriptores y métodos de reconocimiento Dedicación: 8h Grupo grande/Teoría: 3h Grupo mediano/Prácticas: 1h Aprendizaje autónomo: 4h Descripción: Este tema se refiere a: · Descriptores: PCASIFT, SURF, GLOH, DASY, BREVES · Reconocimiento de objetos: Bolsa de palabras, Constelaciones Actividades vinculadas: Clase magistral, resolución de problemas y aprendizaje autónomo a través de ejercicios Objetivos específicos: CB1, CB2, CB3, CB4, CB5, CG1, CG3, CG8, CT2, CT3, CT4, CT5, CT7, CE7, CE9, CE13 6. Correspondencia estereoscópica Dedicación: 8h Grupo grande/Teoría: 3h Grupo mediano/Prácticas: 1h Aprendizaje autónomo: 4h Descripción: Este tema se refiere a: · Geometría Epipolar · Problema de Correspondencia: aproximaciones dispersas y densas · Métodos locales: medidas de distancia. Algoritmo de Shirai. · Optimización Global: SSSD, Relajación, programación dinámica. Actividades vinculadas: Clase magistral, resolución de problemas y aprendizaje autónomo a través de ejercicios Objetivos específicos: CB1, CB2, CB3, CB4, CB5, CG1, CG3, CG8, CT2, CT3, CT4, CT5, CT7, CE7, CE9, CE13 5/8 Universitat Politècnica de Catalunya Última modificación: 20-05-2016 240AR052 - Temas Avanzados en Visión por Computador 7. Reconstrucción 3D Dedicación: 8h Grupo grande/Teoría: 3h Grupo mediano/Prácticas: 1h Aprendizaje autónomo: 4h Descripción: Este tema se refiere a: · Forma a partir de X: fotometría, sombra, enfoque, textura. · Estructura a partir del movimiento. Factorización. · Reconstrucción multivista: Coloreado de Voxel, Talla espacio, forams a partir de siluetas. · Los métodos activos: aviones con láser, juegos de puntos, cámaras TOF, kinect, ¿ Actividades vinculadas: Clase magistral, resolución de problemas y aprendizaje autónomo a través de ejercicios Objetivos específicos: CB1, CB2, CB3, CB4, CB5, CG1, CG3, CG8, CT2, CT3, CT4, CT5, CT7, CE7, CE9, CE13 8. Detección 3D monocular Dedicación: 8h Grupo grande/Teoría: 3h Grupo mediano/Prácticas: 1h Aprendizaje autónomo: 4h Descripción: Este tema se refiere a: · Revisión de la geometría de la cámara · Estimación de la Pose · Detectores robustos · Detección 3D no rígida Actividades vinculadas: Clase magistral, resolución de problemas y aprendizaje autónomo a través de ejercicios Objetivos específicos: CB1, CB2, CB3, CB4, CB5, CG1, CG3, CG8, CT2, CT3, CT4, CT5, CT7, CE7, CE9, CE13 6/8 Universitat Politècnica de Catalunya Última modificación: 20-05-2016 240AR052 - Temas Avanzados en Visión por Computador 9. Forografia computacional Dedicación: 4h Grupo grande/Teoría: 2h Aprendizaje autónomo: 2h Descripción: Este tema se refiere a: · Fotografia con y sin flash · Imagen y vídeo con la focal variable Actividades vinculadas: Clase magistral, resolución de problemas y aprendizaje autónomo a través de ejercicios Objetivos específicos: CB1, CB2, CB3, CB4, CB5, CG1, CG3, CG8, CT2, CT3, CT4, CT5, CT7, CE7, CE9, CE13 Planificación de actividades 1. PEQUEÑO PROYECTO DE VISIÓN POR COMPUTADOR Dedicación: 48h Grupo pequeño/Laboratorio: 10h Aprendizaje autónomo: 38h Material de soporte: Ordenadores y herramientas de software Descripción de la entrega esperada y vínculos con la evaluación: Presentación oral de los métodos desarrollados y resultados Objetivos específicos: Implementar la solución de visión por computador para un problema específico donde el estudiante debe demostrar los conocimientos y habilidades adquiridas a lo largo del curso. Este proyecto se implementará en un lenguaje de programación Sistema de calificación El sistema de evaluación consistirá en los siguientes elementos: - Evaluación de los ejercicios: (30% de la notadel curso) - Evaluación de un examen final: (30% de la notadel curso) - Evaluación del proyecto corto: (40% de la notadel curso) Normas de realización de las actividades Por definir 7/8 Universitat Politècnica de Catalunya Última modificación: 20-05-2016 240AR052 - Temas Avanzados en Visión por Computador Bibliografía Básica: Szeliski, Richard. Computer vision : algorithms and applications [en línea]. London: Springer, cop. 2011 [Consulta: 10/12/2013]. Disponible a: <http://site.ebrary.com/lib/upcatalunya/docDetail.action?docID=10421311>. ISBN 9781848829343. González, Rafael C; Woods, Richard E. Digital image processing. 3rd ed. Harlow: Pearson Prentice Hall, cop. 2008. ISBN 9780131687288. Trucco, Emanuele; Verri, Alessandro. Introductory techniques for 3-D computer vision. Upper Saddle River: Prentice Hall, cop. 1998. ISBN 0132611082. Complementaria: Hartley, Richard; Zisserman, Andrew. Multiple view geometry in computer vision. 2nd ed. Cambridge: Cambridge University Press, 2003. ISBN 0521540518. González, Rafael C; Woods, Richard E; Eddins, Steven L. Digital Image processing using MATLAB. 2nd ed. s.l: Gatesmark Publishing, 2009. ISBN 9780982085400. Klette, Reinhard; Schlüns, Karsten; Koschan, Andreas. Computer vision : three-dimensional data from images. Singapore: Springer-Verlag, 1998. ISBN 9813083719. 8/8 Universitat Politècnica de Catalunya