ICT-UNPA-75-2013 ISSN: 1852-4516 Aprobado por Resolución N° 1091/13-R-UNPA SUPERRESOLUCION: RECONSTRUCCION DE DATOS EN 1D 1 Prof. Sebastián Hernández1 y Dr. Claudio Delrieux2 {Alumno de la Maestría en Informática y Sistemas, UNPA} sebastian.unpa@gmail.com 2 {Docente Investigador, UNS} cad@uns.edu.ar UNPA – UARG Universidad Nacional de la Patagonia Austral – Unidad Académica Río Gallegos Departamento de Ciencias Exactas y Naturales Grupo de Investigación: Computación Gráfica Río Gallegos, Julio 2013 RESUMEN Hoy el procesamiento de imágenes se volvió cotidiano debido a la masificación de equipos que generan, almacenan y muestran imágenes digitales. Esto ocurre porque son necesarias (o deseables) imágenes con mayor resolución y tamaño a medida que se encuentran nuevas aplicaciones que dependen de ellas y el recambio de equipos no siempre es una opción viable. La reconstrucción de imágenes (ya sea ampliación, aumento de resolución o definición de detalles) se hace a través de algoritmos matemáticos. En este informe se propone un algoritmo capaz de identificar regiones y extraer información de ellas en vectores de datos de 1D. Esto es un paso fundamental para poder crear un algoritmo capaz de segmentar e identificar bordes correctamente. Palabras Clave: super resolución; detección de bordes; procesamiento de imágenes. 109 Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional. ICT-UNPA-75-2013 ISSN: 1852-4516 Aprobado por Resolución N° 1091/13-R-UNPA INTRODUCCIÓN Existen dos tipos principales de imagen: vectorial y plana. Las vectoriales son en realidad un conjunto de instrucciones geométricas que un software interpreta y como resultado genera una imagen. En cambio las imágenes planas, generalmente obtenidas con algún dispositivo capturador como una cámara digital o un teléfono celular, poseen información sobre cada uno de los píxeles que las componen. Esto ocurre cuando un dispositivo intenta capturar el espectro de luz visible emitido desde un objeto que incide sobre un sensor digital que procesa y almacena esta información. Uno de los formatos más comunes de representación de una imagen es el espacio cromático RGB, donde cada pixel tiene asociados 3 valores, rojo (Red), verde (Green) y azul (Blue)con valores enteros que van desde 0 hasta 255. La composición de estos tres valores genera, de acuerdo a la sensibilidad del ojo humano, los colores visualizados. Una característica importante de las imágenes planas es su resolución. Cuantos más píxeles pueda capturar un sensor con respecto a una superficie determinada, mejor resolución tendrá, debido a que es mayor la cantidad de información obtenida y almacenada con respecto a un objeto real. Sin embargo, cuando la superficie cubierta por el objetivo de la cámara es mucha, cada píxel se corresponde con una gran cantidad de área real. Por ejemplo, no es lo mismo una foto de un rostro que una imagen satelital. Cada píxel de la segunda imagen contiene información de una gran superficie, pudiendo medirse en metros cuadrados o incluso en kilómetros cuadrados. En cambio, cada píxel de la primera representa una pequeña porción, equiparabletal vez a una superficie medida en milímetros cuadrados. Cuando ocurre que un píxel representa mucha información, es posible que el color almacenado en ese píxel sea combinación de varios colores reales. Esto se aprecia cuando se fotografía desde una distancia considerable, un objeto pequeño o una frontera entre objetos diferentes. Si fotografiamos desde un satélite una cancha de fútbol, posiblemente el píxel que tiene la información del césped y la pelota sea verde, aunque ligeramente diferente de los píxeles que contienen solo césped. En este informe se muestra la generación y aplicación de un algoritmo capaz de identificar cambios de tipos de superficie en una dimensión y determinar con precisión la proporción correcta de superficies diferentes presentes en la frontera.La organización del trabajo es la siguiente: (1) Introducción, (2) Marco histórico, (3) Marco conceptual, (4) Marco teórico, (5) Materiales y Método, (6) Resultados, (7) Discusión, (8) Conclusiones, (9) Recomendaciones y (10) Agradecimientos. MARCOS DE REFERENCIA 1.1. Marco histórico Super resolución es un término que identifica a un conjunto de métodos para mejorar la resolución, de imágenes y videos. Algunos métodos de super resolución se basan en el uso de 110 Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional. ICT-UNPA-75-2013 ISSN: 1852-4516 Aprobado por Resolución N° 1091/13-R-UNPA dos o más tomas del mismo objeto para mejorar la información de que se dispone en cada pixel. Otros métodos proponen el uso de funciones no lineales de reconstrucción, basadas en sistemas polinomiales, tales como Lagrange o Hermite (Alegre et al., 2003), o funciones no derivables, tal como la reconstrucción fractal (Manual Perfect Photo Suite 7, 2013). Finalmente, cuando no se poseen más tomas o no se puede asumir un método paramétrico o procedimental de reconstrucción, el aumento de resolución se realiza a través de las técnicas más simples, conocidas como upscaling o upsampling.El cambio en la resolución tiene como objetivo lograr una mejor definición de los detalles de la imagen aunque no necesariamente implica un cambio en su tamaño. La mayoría de las técnicas de super resolución con cuadros múltiplesse basan en una idea simple: utilizar información de diferentes imágenes con el fin de crear una nueva que aproveche las mejores características de las imágenes utilizadas como base. El primer trabajo de este tipo fue publicado en la década del 80, (Tsai y Huang, 1984) aunque el término super resolución aparece finalmente en los años 90, (Irani y Peleg, 1990). Hoy está extendido y es la base de las mejoras en dispostivos de captura digital como cámaras fotográficas y filmadoras. En la Figura 1 se observa un ejemplo de super resolución logrado combinando 9 imágenes. La imagen resultantefue extraída de (Wikimedia Commons, 2007), donde se observa una mejora importante en los detalles, las claridad de los colores y la reducción del ruido digital. Figura 1: Superresolución obtenida combinando 9 imágenes. Otro problema de índole similar al ya comentado es el de detección de bordes, el cual es un caso particular del problema general de la segmentación, o sea, la separación de figura y fondo, que consiste en identificarla frontera de un objeto del mundo real representado en una imagen. Dentro del lenguaje específico hay dos términos principales, llamando foreground al objeto y background al resto de la imagen, distinta del objeto. Lainterfase entre foreground y background se denomina borde. En la Figura 2 el texto ICT tiene color negro y el fondo es de color gris (0 y 203 en escala de grises respectivamente) y su tamaño real es de 300×250px. 111 Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional. ICT-UNPA-75-2013 ISSN: 1852-4516 Aprobado por Resolución N° 1091/13-R-UNPA Figura 2: Texto ICT sobre fondo gris. Tamaño original. Para simular la digitalización el texto, es decir la transformación en imagen plana, se le aplica una reducción al 25% observable en la Figura 3, lo que es habitual cuando un sensor captura una imagen de un objeto real. Es muy difícil que el área abarcada por un píxel en el sensor corresponda con una superficie equivalente en el objeto real. ¡Sería necesario para esto tener sensores del mismo tamaño que los objetos! Figura 3: Texto ICT sobre fondo gris. Reducción al 25%. La figura 4 se obtiene al ampliar la Figura 3 en un intento de rescatar el tamaño original de la imagen, pero se observa pixelado que distorsiona la imagen, impidiendo detectar claramente la interfase entre background y foreground. Esto muestra que el borde no es tan simple de detectar en una imagen digital como en el objeto real (Marr y Hildreth, 1980). Figura 4: Texto ICT sobre fondo gris. Tamaño original obtenido por ampliación. El efecto comentado ocurre muy seguido cuando se captura una imagen y el sensor está ubicado muy lejos del objeto real, tal como ocurre en las imágenes satelitales. Una imagen satelital es la representación gráfica de una porción de terreno, capturada por el sensor digital de un satélite artificial. Este tipo de digitalización permite observar características especiales de la zona visualizada tales como vegetación, cursos de agua, tipos de suelo, etc. La aplicación de las imágenes satelitales es variada, desde uso civil (estudio de clima, océanos, vientos y suelo) hasta militar (espionaje y reconocimiento de terreno). 112 Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional. ICT-UNPA-75-2013 ISSN: 1852-4516 Aprobado por Resolución N° 1091/13-R-UNPA Además de los ya mencionados existen otros factores que impiden que la imagen digitalizada sea tan clara como el objeto del mundo real: • Digitalización: Es casi seguro que el contorno del objeto real no coincida con la distribución de píxeles en el sensor. Es decir que un píxel que capture informacióndel “borde” contiene información de foreground y background, en porcentajes variables. Un caso real es el satélite LandSat 7, que tiene una banda espectral (Banca Pancromática) con resolución espacial de 15m. Es decir que un píxel de la imagen digitalizada representa un cuadrado de 15m de lado. Es imposible que un teselado en cuadrados de lado 15m coinciada con las divisiones exactas de objetosdel mundo real (parcelas). • Ruido digital: Interactúan también otros factores de índole física, como el tipo de cámara, material y sensibilidad del sensor, temperatura, polvo, movimiento, etc. Es muy difícil que dos píxeles que correspondan al mismo nivel de grises tengan el mismo nivel en la imagen digitalizada. 1.2. Marco conceptual En el caso de objetos del mundo real cuyos colores sean similares, una de las técnicas para identificarlos consiste en utilizar un sensor infrarrojo en vez de uno RGB. Lo que se digitaliza es la radiancia espectral de los objetos y con ello la identificación es más sencilla. Es sabido que los cuerpos calientes emiten radiación térmica en todo el espectro electromagnético, sobre todo en la zona del infrarrojo. Si se mide la radiancia de un cuerpo para todo el espectro de frecuencias, se obtiene la radiancia espectral del cuerpo. Al analizar las curvas obtenidas con el cuerpo a distintas temperaturas, es evidente que esta curva depende fuertemente de la temperatura, y del material debido a que cada material tiene su propia curva de emisividad espectral. Además, a medida que aumenta la temperatura, la frecuencia a la que ocurre la máxima radiancia va aumentando, y pasa del infrarrojo al rojo opaco, luego al rojo brillante y al blanco. Teniendo en cuenta este fenómeno físico,podemos medir diferentes objetos de acuerdo a su radiancia espectral además de hacerlo teniendo en cuenta sus colores visibles. Todo depende de la paleta de colores utilizada en la imagen capturada. Una explicación más detallada se encuentra en el sitio del telescopio espacial Spitzer (Jet Propulsion Laboratory, 2000). 1.3. Marco teórico La detección de bordes es una sección fundamental dentro del análisis de imágenes y la computación gráfica(Bindu Basal, 2012) (Shrivakshan y Chandrasekar, 2012). El poder detectar correctamente la frontera entre foreground y background permite cuantificar superficies en imágenes satelitales (Pena et al, 2012), identificar tejidos extraños (y conocer su tamaño) en imágenes médicas, por dar un par de ejemplos. Existen diversos algoritmos para realizar el trabajo de identificar los puntos en los que el brillo de la imagen cambia bruscamente. La mayoría emplea operadores locales basados en la aproximación discreta de la derivada primera y segunda de los niveles de gris de la imagen. 113 Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional. ICT-UNPA-75-2013 ISSN: 1852-4516 Aprobado por Resolución N° 1091/13-R-UNPA Para un conjunto continuo de datos, es posible aproximar la derivada primera teniendo en cuenta la definición del cociente incremental, por lo que: f '( x) = f ( x) − f ( x + h) , h lo que se denomina primera aproximación por diferencias no centrales y depende del incremento h. En el caso de datos discretos, x y h no son otra cosa que las posiciones de los píxeles en los que se desea aproximar la derivada. En el siguiente ejemplo se muestra la realización de detección de bordes en una fila de píxeles de la imagen constituida por tres rectángulos cuya intensidad de gris es 25, 230 y 140. Al aplicar la aproximación discreta de la derivada primera, Figura 5, se detecta un borde en el píxel 50 y otro en el píxel 100. El tamaño del salto en la función corresponde al cambio en la intensidad de grises y la orientación indica el pasaje de una gama de 25 a 230 (aumento de luminosidad, pico orientado hacia abajo) o cambio de gama de 230 a 140 (disminución de luminosidad). 0 -100 -200 40 80 120 Figura 5: Aproximación discreta de f’(x) con gamas de gris. Este método es simple de implementar y extrapolar para el análisis de imágenes en 2D, sin embargo es sensible al ruido presente en la imagen. Otra forma de detectar bordes es por medio de la similitud con una muestra estándar o clusterización. En este caso, con los métodos de minería de datos, o también data mining, se trata de segmentar (clusterizar) una imagen a través de información extraída de un conjunto de ejemplos existentes (Hernández Orallo et al., 2007). Por medio de esos ejemplos conocidos, se intentará predecir las características de un nuevo dato no perteneciente al conjunto de ejemplos. Es decir que el objetivo es determinar cuán similar es un píxel ubicado en cercanías al borde, con respecto a una región u otra. Para ello, es necesario tener en cuenta que por “similar” se considera la distancia matemática de las características de un píxel con respecto a otro. Las medidas de distancia más tradicionales son aquellas que se aplican sobre dos instancias o ejemplos, tales que todos los atributos son numéricos. Las siguiente son algunas de las métricas más utilizadas: 114 Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional. ICT-UNPA-75-2013 ISSN: 1852-4516 Aprobado por Resolución N° 1091/13-R-UNPA • Distancia Euclídea: d ( x, y ) = • n ∑(x − y ) i =1 i 2 i Distancia de Manhattan: n d ( x, y ) = ∑ xi − yi i =1 • Distancia de Chebychev: d ( x, y ) = max xi − yi i =1,2,..., n También es posible encontrar métodos híbridos que, combinando varias técnicas en simultáneo, consiguen resultados de calidad superior a los identificados a través de métodos simples (Vasavada y Tiwari, 2013). Estos métodos se definen para imágenes en gamas de gris y luego se extrapolan hacia la representación en formato RGB. Algoritmos de ampliación de imágenes Los algoritmos de interpolación (ampliación) de imágenes se basan en el proceso de calcular valores numéricos desconocidos (píxeles) a partir de otros conocidos mediante la aplicación de algoritmos finitos. La idea central es producir una imagen de tamaño superior a la original, completando la información faltante con datos interpolados a partir de un algoritmo específico (González y Woods, 2008). Los siguientes son algunos de los métodos más conocidos y simples de aplicar: • Vecino más cercano: Es el más básico, con resultados de baja calidad si la imagen tiene una gran varación en las gamas de gris. Lo que hace es considerar el píxel más cercano al píxel a interpolar, de forma sencilla puede decirse que sólo se agranda el píxel. A favor puede decirse que requiere un tiempo de procesamiento muy pequeño, en comparación con otros métodos. • Interpolación Lineal: Considera los 4 píxeles más cercanos al que se desea interpolar. La forma de interpolar es calculando el promedio de los valores de gris de los 4 puntos usados como referencia. Debe tenerse en cuenta que la imagen resultante es más suave que la generada por el método del vecino más cercano. Puede causar que la imagen resultante se vea difusa, con poco detalle fino. • Interpolación Bicúbica: Actualmente es uno de los algoritmos de interpolación más utilizado, lo que hace es considerar los 16 píxeles más cercano al que se desea interpolar. O sea, se aproxima localmente el nivel de gris en la imagen original mediante la generación de una superficie polinómica bicúbica. Es el algoritmo óptimo entre tiempo de procesamiento y calidad de la imagen de salida. 115 Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional. ICT-UNPA-75-2013 ISSN: 1852-4516 Aprobado por Resolución N° 1091/13-R-UNPA Método propuesto El método que se propone en este informe se basa en una segmentación por patrones de un vector de datos en 1D para luego interpolar los datos sobre los bordes encontrados. Es decir que, primero se detectará qué píxel es parte del borde de la imagen, y después se calculará la composición de ese píxel que contiene información de los dos patrones que generan la frontera. De esta forma se generará un nuevo vector, con información relativa a los patrones encontrados y con una frontera bien definida entre los patrones. La aplicación de este método no puede realizarse en imágenes puesto que sólo se define para detección de vectores unidimensionales. RESULTADOS, ANÁLISIS Y CONCLUSIÓN 2.1. Materiales y método Como aplicación concreta de lo antes desarrollado, se intentará segmentar correctamente un vector extraído de una imagen digital que contenga datos de dos fuentes diferentes pero del mismo objeto real. Un ejemplo claro de esto es dos imágenes digitales, del mismo objeto real, pero capturadas con diferentes sensores, uno RGB y otro infrarrojo. Para determinar qué proporción tienen de cada clase los píxeles del borde es necesario lograr la identificación automática. Para ello se ejecuta el código en EulerMath: function bases(x:real) n=length(x); p=4; ## longitud de la base a analizar, contiene dos tipos de información baseA=[134,80,113,76];## datos conocidos de antemano, identifican a un material em concreto baseB=[72,226,69,180]; baseC=[155,141,178,234]; pA=zeros(1,n/p); pB=pA; pC=pA; for i=1 to n/p;## compara similitudes de cada componente con alguna de las bases conocidas pA[i]=1-round(sum(abs(x[p*i-3:p*i]-baseA))/1020,2); pB[i]=1-round(sum(abs(x[p*i-3:p*i]-baseB))/1020,2); pC[i]=1-round(sum(abs(x[p*i-3:p*i]-baseC))/1020,2); end x2=pA_pB_pC; return x2 endfunction A modo de ejemplo, segenera un vector de pruebaV con datos que pueden ser de la clase A, B o C, con las siguientes características de información: • A=[134,80,113,76] • B=[72,226,69,180] 116 Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional. ICT-UNPA-75-2013 ISSN: 1852-4516 Aprobado por Resolución N° 1091/13-R-UNPA • C=[155,141,178,234] Los datos de V son generados de la siguiente forma: • V=[A1 | A2 | 0.359*A3+0.641*B1 | B2 | B3 | 0.234*B2+0.766*C2 | C1 | C3| A2] para simular la respuesta que tendrá un sensor digital (o dos como en este caso) a la radiación electromagnética recibida. Los datos simulados del ejemplo anterior: • A1=[ 132 80 112 76 ] • A2=[ 133 80 113 76 ] • A3=[ 132 80 111 76 ] • B1=[ 72 224 69 180 ] • B2=[ 70 226 69 180 ] • B3=[ 72 227 69 180 ] • C1=[ 155 139 178 234 ] • C2=[ 154 142 178 234 ] • C3=[ 56 141 176 234 ] • C4=[ 156 141 176 234 ] Es decir que los datos son muy similares a los datos utilizados como base para clusterizar. Las diferencias en la información radican en los problemas ya comentados de las imágenes como ruido, movimientos en el sensor, tipo de sensor, etc. Es de notar que la tercera y sexta componente de V contienen información mezclada de dos tipos, aunque no se sabe las proporciones de la mezcla de información. Esto indica que el borde (o la frontera entre las dos regiones adyacentes) se encuentra en esos píxeles. Aplicando el código de detección e identificación se obtiene como resultado: V=[A | A | 0 | B | B | 0 | C | C | A], donde 0 indica la presencia de un píxel frontera. El resto de la información es clusterizada de acuerdo a las bases conocidas. En los píxeles con valor 0 se identifica una mezcla de información de las bases adyacentes. Para analizar en detalle esos píxeles (y detectar las proporciones que tiene de cada base) se aplica el código: function resolver(vec, baseA, baseB, baseC, x) n1=length(vec); ## vec es string y tiene las bases identificadas y valores 0 del borde n2=length(x); ## x es el vector de la imagen a filtrar n=n2/n1; ## longitud de las bases for i=1 to n1 if vec[i]=="0"##se analiza sólo aquellos elementos que tienen información mezclada if vec[i-1]=="A" then base1=baseA; endif if vec[i-1]=="B" then base1=baseB; endif if vec[i-1]=="C" then base1=baseC; endif if vec[i+1]=="A" then base2=baseA; endif 117 Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional. ICT-UNPA-75-2013 ISSN: 1852-4516 Aprobado por Resolución N° 1091/13-R-UNPA if vec[i+1]=="B" then base2=baseB; endif if vec[i+1]=="C" then base2=baseC; endif## se identifican las bases adyacentes, a fin de poder resolver un sistema de ecuaciones lineales sobredimensionado round(svdsolve((base1_base2)',x[(i-1)*n+1:i*n]'),3) endif end endfunction El código antes mostradoresuelve un sistema de ecuaciones lineales sobredimensionado por medio de la descomposición en valores singulares, (Burden y Faires, 2002),y da como resultado la proporción de cada una de las bases utilizadas. En el ejemplo ya presentado, para el primer elemento 0, el planteo es el siguiente α . A + β .B = V [3] , y el cálculo de la composición de los dos píxeles del borde da como resultado α=0.352 y β=0.641 para el primer borde y para el segundo α=0.235 y β=0.759, lo que es cierto dentro de un pequeño margen de error, recordando la forma en que fueron generados. 2.2. Resultados La segmentación del vector de prueba se realizó por comparación con un patrón definido, utilizando distancias entre las gamas de gris de los píxeles. El resultado final, es decir, la detección de la composición de cada píxel frontera se obtuvo a través de la resolución de un SEL sobredimensionado por medio del método de descomposición en valores singulares.A partir de esto, también será posible redimensionar un vector de 1D en otro sin perder información de la frontera. Retomando el ejemplo numérico, si se intentara aumentar el tamaño al triple del vector V, quedaría el triple de elementos (píxeles). Se centrará la atención en las componentes, ya clusterizadas,2 a 4 debido a que la componente 3 contiene la frontera: V = [… | A | 0 | B | …] V* = [… | A | A | A| 0 | 0 | 0 | B | B | B | …] O sea que la frontera, es decir los píxeles que la contienen, también se han triplicado. Sin embargo, al conocer la proporción de las clases será posible reescribirlo de la siguiente manera: V* = [… | A | A | A| A | k1.A+k2.B| B | B | B | B | …], El primer píxel frontera se identifica íntegramente como clase A, ya que su componente original, y por ende de toda la frontera, era 35,2% A y 64,1% B. El tercer píxel, del mismo modo que el anterior, se transforma en clase B. En cambio el píxel frontera intermedio, debe tener componentes tanto de clase A como de clase B, entonces por medio de proporciones se calcula que k1 = 0.019 y k2 = 0.308. Es decir que la frontera nuevamente queda contenida en un solo píxel y no se desparrama esta información hacia los píxeles adyacentes. 118 Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional. ICT-UNPA-75-2013 ISSN: 1852-4516 Aprobado por Resolución N° 1091/13-R-UNPA 2.3. Discusión Las siguientes son preguntas aún abiertas, que espero poder responder durante el desarrollo de la tesis. • ¿El resultado será el mismo si se aplica en imágenes 2D tomando el vector de prueba como filas o columnas de la imagen original? • ¿Es un algoritmo sensible al ruido cuando éste afecta al borde? • ¿Qué tan fiable será el modelo en caso de muestras (clases) muy parecidas en ambos tipos de dato (RGB e infrarrojo)? • ¿Podrá utilizarse algún otro método numérico para predecir las regiones en el caso de que las bases sean similares en intensidad de gris? Por el momento no es posible comparar los resultados obtenidos con imágenes en 2D puesto que el método propuesto se desarrolla en 1D. Se tendrá en cuenta, una vez ampliado el algoritmo para datos en 2D, la comparación con los métodos propuestos, aunque no se encuentra en la bibliografía la superresolución a partir de dos tipos diferentes de imagen. Éste es uno de los motivos por el cual el avance es lento. CONCLUSIONES El algoritmo presentado para identificación de bordes en vectores de 1D se ejecuta con bajo tiempo de cómputo y obtiene resultados de calidad para un vector generado en forma manual. Es necesario conocer la información básica que corresponden a las regiones, a fin de poder detectar el borde. En el caso de no conocer la información de las regiones, es posible calcularla por medio del algoritmo de K-Medias.La etapa experimental del trabajo a futuro incluye la ampliación de este algoritmo para matrices de datos (imágenes en gamas de gris). RECOMENDACIONES Con el fin de aprovechar los diferentes tipos de información, debe considerarse que la información de cada clase corresponde a datos de gama de gris (o RGB) y la medición correspondiente en infrarrojo. Esto se hará con el fin de evitar que colores parecidos devuelvan clases parecidas, la componente infrarroja generará una diferencia sustancial. AGRADECIMIENTOS A Claudio Delrieux por el apoyo, paciencia y tiempo dedicado. A María Laura Ivanissevich, por la búsqueda de información y revisiones periódicas. 119 Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional. ICT-UNPA-75-2013 ISSN: 1852-4516 Aprobado por Resolución N° 1091/13-R-UNPA REFERENCIAS Alegre E., Sánchez L., Fernández R. Á., Mostaza J. C., 2003. Procesamiento Digital de Imagen: fundamentos y prácticas con Matlab. Universidad de León. Bindu Bansal, et al. (2012) Comparison of Various Edge Detection Techniques. Journal of Information and Operations Management ISSN: 0976–7754 & E-ISSN: 0976–7762, Volume 3, Issue 1, pp– 103-106. Burden R. y D. Faires, 2002, Análisis Numérico. Ed. Thompson, séptima edición. González R. C. y Woods R. E., 2008, Digital Image Processing, 3rd edition. Pearson Education. Hernández Orallo J., Ramírez Quintana J. y Ferri Ramírez C., 2007, Introducción a la Minería de Datos. Pearson Educación. Irani M. y Peleg S., 1990, “Super Resolution From Image Sequences” ICPR, 2:115--120. Jet Propulsion Laboratory, 2000, “Grupo de Educación y Difusión Pública en el Centro Científico Spitzer”. http://legacy.spitzer.caltech.edu/espanol/edu/learn_ir/ Marr D. y Hildreth E., 1980, “Theory of Edge Detection”, Proceedings of the Royal Society of London. Series B, Biological Sciences 207 (1167): 187—217. Manual Perfect Photo Suite 7, 2013, p212, onOne Software, versión digital. Pena N., Garza G., Cao Y. y Qiao Z., 2012, “Edge Detection of Real Synthetic Aperture Radar Images through Filtered Back Projection”, in International Conference on Systems and Informatics Shrivakshan G.T. y Chandrasekar C., 2012, “A Comparison of various Edge Detection Techniques used in Image Processing” in IJCSI International Journal of Computer Science Issues, Vol. 9, Issue 5, No 1. TsaiR. Y. y HuangT. S., 1984, “Multiframe image restoration and registration”, in Advances in Computer Vision and Image Processing, vol. 1, chapter 7, pp. 317--339, JAI Press, Greenwich, Conn, USA. Vasavada J. y Tiwari S., 2013, “A Hybrid Method for Detection of Edges in Grayscale Images” in I.J. Image, Graphics and Signal Processing, DOI: 10.5815/ijigsp.2013.09.04. Wikimedia Commons, 2007, “File:Super-resolution example http://en.wikipedia.org/wiki/File:Super-resolution_example_closeup.png closeup.png”. 120 Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional.