Tema Selecto: Procesamiento Digital de Imágenes Prof. Dr. Jorge Márquez Flores CCADET-UNAM Tarea de entrenamiento 1 y 2 – marzo 10, 2008 Instrucciones: (a), lea con cuidado sus apuntes; (b), estudie las preguntas identificando el tema; (c), vuelva a estudiar las notas del curso para entender bien lo que se pregunta, y (d), responda “todo lo que pueda, lo mejor posible”. Entregar el lunes 3 de marzo. Minimice el rollo y maximice las matemáticas. Procure trabajar primero de forma individual y discuta al final con sus compañeros. Nota: en las preguntas pueden venir nociones o términos complementarios no usados en los apuntes. 1. Vimos un caso de segmentación por umbralaje: dada una imagen I(x,y) y un umbral u se obtiene una imagen binaria donde el 1 indica aquellos pixeles que cumplieron con tener un valor mayor al umbral (los que no, se mapean a 0). Consulte la definición matemática vista en clase y describa la definición de una imagen binaria obtenida a partir de un criterio donde el objeto a segmentar debe tener valores de gris entre 40 y 60 o entre 180 y 190, o igual a 220. 2. La transformada de Fourier 2D (TF, sea discreta o continua) caracteriza a una imagen en el dominio de frecuencias (espaciales, por ejemplo número de líneas por cm). Diga cómo se relaciona la TF con la convolución en dominio espacial y cómo se interpreta ésta en dominio de frecuencia. Escriba ecuaciones adecuadas a la respuesta. 3. Vimos en clase una definición constitutiva de imagen generalizada (información multidimensional). En Teoría de la Información se habla de un mensaje -“el qué”-, que se codifica -“el cómo”- y se transimte por algún canal a un destinatario. Si agregamos un “dónde” y un “cuándo”, identifique los equivalentes a “qué, cómo, cuándo y dónde” con los elementos de la definición de imagen vista en clase. 4. Si una imagen I(x,y) es degradada por la PSF h(x,y) de un sistema de adquisición lineal invariante a traslación, (por ejemplo el desenfoque debido a lentes), obteniendo la medición Iobs(x,y) (imagen degradada) proponga una operación para restaurar la imagen y obtener (idealmente) I(x,y). ¿Por qué no es posible en la práctica una restauración exacta? (ya sabemos que hay ruido, pero explique matemáticamente o computacionalmente lo que sucede). Indique también qué condiciones debe cumplir h(x,y) para la restauración propuesta. 5. Dada la imagen de la figura siguiente (Fig 1.), grafique de forma aproximada el histograma de sus niveles de gris, indicando a qué corresponden en la imagen los razgos principales del histograma. Figura 1. 6. Considerando la misma figura 1, ¿cómo podemos mejorarla visualmente (ver figura 2), es decir, realizar un realce do contraste, y qué ocurre con el nuevo histograma? Dibuje a ojo la función de transferencia que aplicaría para obtener la figura 2. Figura 2. NOTA: después y sólo después de contestar 4 y 5, use ImageJ con las imágenes boats.jpg y boats2.jpg que hallará en http://www.ccadet.unam.mx/~jorge.maquez/Cursos/Imagenes/boats.jpg (idem 2). y usando la función de ajuste e hostograma verifique sus respuestas. Use si es posible la misma función de mejora en contraste de Photoshop (o Gimp, u otro software) y grafíquela. 7. Considere la siguiente “imagen” de 34 pixeles x(m,n): 0 2 0 3 1 4 3 6 1 5 1 0 (A) Calcule la convolución de x(m,n) con las siguientes secuencias (discretas) de dispersión puntual (respuestas a impulso discreto): 0 1 0 (a) 1 4 2 , 0 1 0 2 (b) 2 4 1 , (c) 3 1 donde el elemento en “negrillas” se refiere al centro h(0,0). (B) ¿Cuál es el efecto de los núcleos (a) y (b)? (C) Usando ImageJ o Matlab, verifique sus resultados (hacer primero a mano, paso a paso) y pruebe las convoluciones en cualquier imagen. Explique en detalle sus respuestas y pasos seguidos. 8. A un mes de clases, ¿qué recomienda para mejorar el curso de Procesamiento de Imágenes?, ¿qué es lo que no le gusta y lo que sí? Tarea de entrenamiento 2 – marzo 19, 2008 9. ¿Para qué es importante conocer los mecanismos del Sistema Visual Humano en las disciplinas de procesamiento de imágenes y reconocimiento de patrones. 10. El producto (“punto a punto” o “pixel por pixel”) de dos imágenes se denomona también “modulación” (se sobreentiende “modulación en amplitud”). (a) Experimente con dicho producto en ImageJ o Photoshop y note lo que hacen zonas obscuras y zonas claras de una imagen A al multiplicar las respectivas regiones en otra imagen B. Tome una región texturada (árboles con gente, etc) y trate de crear con ella y otra imagen moduladora, una imagen que parezca una esfera tridimensional con la textura de la primera imagen (necesita crear con las herramientas de Photoshop la imagen moduladora). (b) ¿Cuál es la interpretación del producto de dos imágenes en el dominio de frecuencia espacial? ¿A qué equivale la modulación en frecuencia en dominio espacial de dos imágenes?, dé ejemplos de aplicación para ralce y reestauración.(A) Encuentre el valor de la mediana de la imagen discreta en la figura 1 (los números son la intensidad luminosa). (B) Defina un filtro basado en la mediana y aplíquelo obteniendo la imagen resultante, explicando su efecto. (C) Encuentre la moda del histograma de la imagen en la figura 1. ¿es única?, ¿le sirve para discernir entre las componentes existentes que destacan? (note que no se muestra la versión en grises, conde podría fácilmente responder a la pregunta anterior). 0 2 -1 0 0 0 4 2 2 20 0 2 8 -9 2 2 24 2 4 4 2 4 16 0 8 1 4 12 9 7 Figura 1. 11. Un estudiante en posgrado de ingeniería eléctrica diseña para su tesis un sistema de imaginología médica cuya salida está caracterizada por una PSF gaussiana isotrópica de sigma radial igual a r = 2.5 centésimas de mm, y amplitud normalizada a 100 UIL (unidades de intensidad luminosa). Proporcione una medida del poder de resolución de dicho sistema, usando como criterio el FWHM y calcule dicha medida. Ilustre gráficamente. 12. (A) Encuentre el valor de intensidad RMS de la imagen en la figura 1 (los números son la intensidad luminosa). (B) Defina un filtro de remoción de fondo y aplíquelo obteniendo la imagen resultante. (C) Si la imagen se tratara de una textura, es posible definir un descriptor de las variaciones respecto al valor medio (todo global), proponga un descriptor que pondere más las fluctuaciones grandes y calcúlelo. 0 2 1 0 0 0 4 2 2 20 0 2 8 2 2 2 24 2 4 4 2 4 16 0 8 2 4 12 8 6 Figura 1. 13. (Opcional) formule el problema anterior mediante un script de MATLAB; aunque no vendrá tal cosa en un examen, podría subir puntos si lo hace. Ya que tenga su programita, haga una convolución gaussiana con un núcleo de 5x5 y sigma 0.5 (no olvide normalizar). 14. Considere un contorno cerrado 2D especificado por N vértices C={(xn, yn)}n=1,…,N. ¿Cuál es la expresión matemática del contorno obtenido por filtrado local móvil pasa-bajas de C, si se el núcleo del filtro es un conjunto de valores W, a orden K, causal (es decir, sólo considerando K vecinos anteriores, con K<N)? Considere que el filtro pasa-bajas es una función gaussiana 2D. Grafique un ejemplo aproximado en 2D, interpretando el efecto de tal filtrado. 15. Vimos en clase un promedio local móvil con núcleo o ventana W={wk}k= -K,…,K, (ponderaciones; en caso de ventana simétrica, wk= w-k)) para una señal discreta unidimensional o un vector de N muestras. Escriba la expresión equivalente para una imagen discreta (o arreglo) de NM. ¿Qué ocurre si la ventana es la función “puerta” (i,j)? (escriba su definición). Escriba la expresión cuando dicho promedio local móvil 2D equivale exactamente a una convolución bidimensional. Hint: no se haga bolas con los índices, este es un puro ejercicio de notación y pasar de 1D a 2D. 16. (A) Calcule la respuesta a impulso del siguiente sistema tridimensional (un ejemplo es una secuencia de imágenes en que la tercera dimensión es el tiempo) y diga si es lineal e invariante a corrimiento (justifique por qué es o no es lineal y por qué es o no es invariante a corrimiento): M 1 N 1 2 rm 2 sn g (r , s) f (m, n) exp i exp i , M N m0 n 0 donde i 1 Hint: es menos difícil de lo que parece… identifique las variables y dominios, haga primero una versión simplificada en una dimensión.