UNIVERSIDAD SIMÓN BOLÍVAR DECANATO DE ESTUDIOS PROFESIONALES COORDINACIÓN DE INGENIERÍA DE LA COMPUTACIÓN PROCESAMIENTO DE IMÁGENES PARA DETECTAR GUSANOS C. ELEGANS Por: JAVIER FERNÁNDEZ Realizado con la asesorı́a de: PROF. ALEXANDRA LA CRUZ. Ph.D. JOHAN HENRIKSSON. M.Sc. PROYECTO DE GRADO Presentado ante la Ilustre Universidad Simón Bolı́var como requisito parcial para optar al tı́tulo de Ingeniero en Computación Sartenejas, Enero de 2011 Resumen El nematodo C. elegans es un organismo ampliamente utilizado en la investigación cientı́fica, particularmente en biologı́a y quı́mica. Posee muchas células con equivalentes humanos y otras condiciones especialmente favorables, que lo han convertido en modelo de estudio para la biologı́a, especialmente en la genética del desarrollo. Ası́ mismo, al ser pequeño y transparente se presta bien a una gran variedad de técnicas de cribado de alto rendimiento (HTS, por sus siglas en inglés 1 ). La identificación de gusanos deberı́a automatizarse lo más posible dado que es muy trabajoso efectuarla manualmente. En este trabajo se presenta un algoritmo de procesamiento de imágenes para detectar C. elegans en imágenes obtenidas por microscopı́a de alto rendimiento. Ası́ mismo, se provee una metodologı́a general de detección de gusanos. La solución semi-automática que aquı́ se presenta, permite identificar eficazmente gusanos individuales en agrupaciones de gusanos. En términos generales, el proceso consta de lo siguiente: una imagen dada es segmentada, separando ası́ grupos de gusanos del fondo de la imagen. Se detectan gusanos individuales de manera automática, siguiendo un proceso de comparación y ajuste de siluetas de gusanos. Este proceso se basa en encontrar siluetas factibles dentro de una agrupación, minimizando la distancia que existe entre dicha agrupación y siluetas genéricas que son deformadas para ajustarse a ella. Las conformaciones de gusanos ajustadas incorrectamente pueden ser corregidas fácilmente de manera manual. La solución provista presenta un enfoque innovador para detectar exitosamente gusanos C. elegans individuales en imágenes de microscopio. Los resultados muestran que esta solución semi-automática permite detectar, correctamente, la forma del 100 % de los gusanos presentes en una imagen determinada. Para el conjunto de prueba utilizado, el proceso es completado en menos de 60 segundos en imágenes con alta densidad de gusanos. Para imágenes con baja densidad, los gusanos pueden ser identificados en su totalidad de manera enteramente automática, en un tiempo menor a 10 segundos. La precisión de la detección y el tiempo requerido para calcularla son mejorados notablemente con respecto a la identificación manual. La solución fue implementada en Java e integrada a Endrov, una arquitectura de extensiones de código abierto para análisis de imágenes, y está siendo utilizada en el Departamento de Biociencias y Nutrición del Instituto Karolinksa, Flemingsberg, Suecia. 1 En inglés, el acrónimo HTS se refiere a High-throughput screening iv Índice general Introducción 1. MARCO TEÓRICO 1.1. Endrov . . . . . . . . . . . 1.2. Método del Valor Umbral 1.3. Transformada de Distancia 1.4. Skeletonization . . . . . . 1.5. Ajuste de formas . . . . . 1.6. Descriptores de Forma . . 1.7. Splines . . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2. METODOLOGÍA DE LA SOLUCIÓN 2.1. Diseño de la Metodologı́a: Razonamiento Previo . . . . . 2.2. Descripción de la Metodologı́a e Implementación . . . . . 2.2.1. Descripción General . . . . . . . . . . . . . . . . 2.2.2. Segmentación Inicial (Método del Valor Umbral) . 2.2.3. Transformada de Distancia . . . . . . . . . . . . . 2.2.4. Skeletonization . . . . . . . . . . . . . . . . . . . 2.2.5. Segmentación de Gusanos . . . . . . . . . . . . . 2.2.6. Descriptor de Forma . . . . . . . . . . . . . . . . 2.2.7. rasterización de Siluetas . . . . . . . . . . . . . . 2.2.8. Detección y Ajuste de Formas . . . . . . . . . . . 2.2.9. Corrección Manual . . . . . . . . . . . . . . . . . 3. EXPERIMENTOS Y RESULTADOS 3.1. Experimentos . . . . . . . . . . . . . 3.2. Resultados . . . . . . . . . . . . . . . 3.2.1. Procesamiento Inicial . . . . . 3.2.2. Detección y Ajuste de Formasptimización de Energı́a . . . . . . . . . . . . . . . . . . . . . . . . . 51 Conclusiones y Trabajos Futuros 54 Bibliografı́a 58 A. Imágenes adicionales obtenidas a través de la A.1. Ajuste de Formas y Corrección Manual . . . . A.2. Transformada de Distancia . . . . . . . . . . . A.3. Esqueleto Topológico de Gusanos . . . . . . . A.4. Método del Valor Umbral . . . . . . . . . . . vi solución implementada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 61 61 62 62 Índice de tablas 3.1. 3.2. 3.3. 3.4. 3.5. 3.6. Caracterı́sticas del conjunto de prueba . . . . . . . . . . . . . . . . Mejor valor de percentil para el conjunto de prueba . . . . . . . . . Detección y ajuste de puntos extremos de gusanos en el conjunto de Resultados del ajuste automático de gusanos en la imagen 1 . . . . Resultados del ajuste automático de gusanos en la imagen 2 . . . . Resultados del ajuste automático de gusanos en la imagen 3 . . . . . . . . . . . . prueba . . . . . . . . . . . . . . . . . . 44 46 47 49 50 51 Índice de figuras 1.1. Imagen en escala de grises antes y después de aplicar un método del valor umbral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Distancias a partir de un punto para seis transformadas de distancia . . . . . 1.3. Imagen binaria y esqueleto topológico de una figura de caballo . . . . . . . . 2.1. Descripción gráfica de la metodologı́a para detectar gusanos C. elegans en imágenes digitales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Gusanos en medio lı́quido. Imagen original e imagen binaria obtenida a través del método del valor umbral por percentil, con un percentil de 0.074 . . . . . 2.3. Tres vecindades direccionales . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4. Construcción de una forma de gusano basada en un descriptor de forma . . . 3.1. Conjunto de imágenes de prueba . . . . . . . . . . 3.2. Mejor ajuste automático en la imagen 1 . . . . . . . 3.3. Valor de energı́a de las tres mejores conformaciones conjunto de prueba . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . por punto . . . . . . . . . . . . . . . . extremo . . . . . 8 9 10 20 24 29 34 . . . . . . en el . . . 44 49 A.1. Mejor ajuste automático y corrección manual en para la imagen original A.1a A.2. Mejor ajuste automático y corrección manual en para la imagen original A.2a A.3. Imagen binaria y tres mapas de distancia utilizando diferentes métricas, a partir de la imagen de un gusano . . . . . . . . . . . . . . . . . . . . . . . . A.4. Esqueleto topológico de una imagen de gusanos en cultivo lı́quido . . . . . . A.5. Diferentes métodos del valor umbra aplicados a una imagen de gusanos en medio lı́quido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 64 53 65 66 67 1 Introducción El nematodo C. elegans es un organismo ampliamente utilizado y se ha convertido en un importante modelo de estudio para la biologı́a, especialmente en la genética del desarrollo. Este organismo presenta la ventaja de que todos los individuos son exactamente iguales a nivel celular, poseen cortos ciclos de vidas y una rápida genética. Por esta razón, se pueden detectar tipos salvajes de este organismo y los experimentos son menos costosos, en comparación con organismos más complejos. Es el único animal del que se conoce cada división celular, desde la fertilización del huevo hasta la etapa adulta, ası́ como el diagrama completo de las conexiones de las células que lo componen. El C. elegans tiene muchas células con equivalentes humanos, lo que hace posible estudiar y comprender cómo se manifiestan ciertas enfermedades y condiciones relacionadas, e.g. adicción a las drogas, envejecimiento, disfunción de ciertas proteı́nas, entre otras. Ası́ mismo, al ser pequeño y transparente, se presta bien a una gran variedad de técnicas de cribado de alto rendimiento (HTS, por sus siglas en inglés). El HTS es un método de experimentación cientı́fica que permite conducir millones de pruebas genéticas, bioquı́micas o farmacológicas, a través de la robótica, software de control y procesamiento de datos, dispositivos para el manejo de lı́quidos y detectores sensitivos. A través de este proceso se pueden identificar rápidamente componentes activos, anticuerpos o genes que modelan procesos biomoleculares particulares, tal como se indica en [30]. Diversos ganadores del premio Nobel de Medicina o Fisiologı́a han centrado sus estudios en gusanos, y en particular C. elegans, tales como Brenner, Sulston y Horvitz (2002), Fire y Mello (2008), ası́ como el ganador del Nobel de Quı́mica, Martin Chalfie (2008). Antes de ser cuantificados, los gusanos deben ser identificados. Este proceso deberı́a ser automático debido a que es muy trabajoso para ser efectuado manualmente en un tiempo factible. Curiosamente, a pesar de la utilidad del C. elegans para manipulaciones genéticas, su utilización en procesos de cribado de alto rendimiento se ha visto limitado por la necesidad de ensayos manuales muy trabajosos. Lo anterior conlleva a la necesidad de métodos más rápidos y consistentes. Por esta razón, un programa de computadora que permita detectar individuos C. elegans en imágenes digitales, proveerı́a una solución automática para el problema de reconocimiento. Esto mejorarı́a tanto la precisión, como el tiempo requerido para la identificación de los individuos, con respecto a la identificación manual, permitiendo, a su vez, transformar las imágenes en in- 2 formación manejable. El presente estudio, se centra en el diseño e implementación de un algoritmo de procesamiento de imágenes para detectar gusanos C. elegans en imágenes de microscopio. Se provee, ası́ mismo, una metodologı́a general de detección de gusanos. La caracterı́stica más relevante para la mayorı́a de los experimentos con C. elegans es la forma del gusano, y en ocasiones también la rotación y dirección de la misma. El enfoque presentado en este documento, busca identificar, exclusivamente, la forma de los gusanos. Se estudia, entonces, si es posible detectar y ajustar estas formas de manera automatizada, y si esto puede alcanzarse más rápidamente que a través de la identificación manual. Se utilizan gusanos, en estado de larva, en placas de microtitulación. Las larvas se cultivan en medio lı́quido, lo que causa que el fondo de las imágenes sea muy claro. No obstante, los gusanos se solapan con frecuencia. La implementación del algoritmo que se deriva de la metodologı́a desarrolladaes integrada a Endrov, una arquitectura de extensiones de código abierto, dirigida al análisis de imágenes y procesamiento de datos, que fue desarrollada y es actualmente utilizada en el Departamento de Biociencias y Nutrición del Instituto Karolinksa, lugar donde se desarrolla este proyecto. El objetivo general de este proyecto es el de diseñar e implementar una metodologı́a basada en procesamiento de imágenes para detectar gusanos en imágenes de microscopio. Para lograr este objetivo se definieron dos objetivos especı́ficos. El primero es el de diseñar un algoritmo de detección de gusanos que reciba como entrada imágenes de gusanos en cultivo lı́quido y retorne la forma de los gusanos presentes. Este objetivo especı́fico engloba las siguientes actividades: revisar los antecedentes relevantes en técnicas de segmentación de imágenes; diseñar un descriptor de forma y un método de rasterización 2 para representar gusanos en términos numéricos; revisar los antecedentes en ajuste de formas y reconocimiento de objetos, y proponer un enfoque de detección. El segundo objetivo especı́fico consiste en implementar el algoritmo de detección diseñado, integrándolo a Endrov como extensión o plug-in. Existen diversos antecedentes relativos al desarrollo de métodos que involucran la detección de gusanos en imágenes. Particularmente, el hecho de que la utilización del C. elegans en experimentos que involucran cribado genético y quı́mico se haya incrementado rápida y 2 Término comúnmente utilizado en computación gráfica, derivado del término en inglés rasterization. Se refiere al proceso por el cual una imagen descrita en un formato de gráfico vectorial se convierte en un conjunto de pı́xeles o puntos. 3 notablemente, ha dado pie al desarrollo de métodos automatizados para analizar su comportamiento, en experimentos conducidos sobre grupos de estos organismos, tal como se indica en [4]. En el estudio mencionado, se dividen las estrategias existentes para el análisis automatizado del C. elegans en tres grandes grupos, de acuerdo a su enfoque metodológico, a saber: seguimiento del comportamiento general, detección y medición de comportamientos distintos, y medición completa del comportamiento utilizando grandes conjuntos de datos. Todas estas estrategias incluyen una etapa fundamental, que se centra en la detección de los gusanos en el conjunto de imágenes que se utilizan. El enfoque de detección varı́a de una estrategia a otra, pero, por lo general, comprende los procesos siguientes: extracción de los gusanos del fondo de la imagen (segmentación), calculo del esqueleto toplógico de las formas extraı́das (skeletonization) y parametrización del contorno de los gusanos. La skeletonization y subsecuente parametrización, se han convertido en un método estándar. Sin embargo, dado que las propiedades de la imagen tales como iluminación, ruido y desorden (e.g. huevos y rastros de gusanos) pueden variar fuertemente de una imagen a otra y debido a que la segmentación depende directamente del contexto visual, los parámetros de este último proceso resultan altamente variables. Los métodos de segmentación más utilizados en imágenes de gusanos comprenden: cerrado morfológico, llenado de agujeros, método del valor umbral y sus combinaciones. La parametrización de gusanos, que consiste en la descripción de formas de gusanos en términos numéricos, determina la variedad de formas que pueden obtenerse a través de la asignación de diferentes valores a los parámetros. El enfoque más común se centra en definir parámetros que permitan la reproducción de una forma de gusano genérica, normalizada para la posición, orientación y escala de un esqueleto de gusano. En [4], se sostiene que entre aquellos programas que hacen seguimiento de múltiples gusanos, muy pocos intentan resolver el problema de solapamiento, que surge cuando dos o más gusanos se cruzan entre sı́, o bien cuando gusanos individuales se enrollan, lo que suele llevar a detecciones incorrectas o faltantes. Pese a que hay algoritmos que están siendo desarrollados para resolver este problema, tal como se indica en [8], se sigue careciendo de soluciones que permitan detectar la totalidad de los individuos de forma automática. Estudios muy recientes presentan nuevos enfoques para detectar gusanos individuales en agrupaciones enredadas (aquellos donde ocurre solapamiento). Riklin Raviv et al. en [16] presentan un enfoque para extraer objetos enredados, basado en sus propiedades morfológicas. 4 Este estudio aborda el problema de desenredar agrupaciones de C. elegans en experimentos de cribado de alto rendimiento. Este método se basa en conceptos de aprendizaje de máquina y teorı́a de grafos, y utiliza el esqueleto del gusano como un descriptor de forma. Los segmentos de agrupaciones de gusanos son representados como vértices de grafo y se lleva a cabo una búsqueda de los caminos de gusanos más prometedores en el grafo. La detección de los descriptores de forma más prometedores dentro de la búsqueda, es guiada por una distribución de probabilidad, basada en el modelo probabilı́stico presentado en [27]. Los enfoques presentados en [16, 27] corresponden a estudios consecutivos y complementarios centrados en la detección de gusanos individuales en imágenes digitales. Los resultados presentados indican un porcentaje de detección acertada de 89 % del total de la muestra, en promedio. Es importante destacar que los dos estudios previamente mencionados fueron desarrollados al mismo tiempo que el presente trabajo y con similares fechas de finalización, por lo que habı́a desconocimiento de su existencia. No obstante, el enfoque de detección y la metodologı́a presentada en este trabajo, es diferente a los presentados en los estudios mencionados. En particular, este trabajo sigue un enfoque detección basado en el modelo de ajuste de formas por optimización, mientras que los trabajos previamente mencionados siguen un enfoque de ajuste por decisión, de acuerdo a la clasificación descrita en la Sección 1.5. Existen entonces, diversos estudios en procesamiento de imágenes y visión artificial que tratan el análisis automatizado del C. elegans y de nematodos en general. La mayorı́a de estos estudios se centran en la locomoción de gusanos, donde el proceso de identificación y seguimiento es realizado a través del procesamiento simultáneo de un conjunto de imágenes y no sólo de una. Se evidencian tres procesos fundamentales en las estrategias de detección como lo son: segmentación de la imagen, skeletonization y parametrización de forma. El resto de los procesos involucrados en la detección varı́an dependiendo del enfoque, e involucran, en casi todos los casos, el procesamiento de conjuntos de imágenes y no de imágenes individuales, como fue antes mencionado. A pesar de que algunos métodos automatizados de detección de gusanos son capaces de detectar correctamente una gran parte de la muestra, pocos intentan resolver el problema del solapamiento de gusanos y ninguno lo soluciona exitosamente. Este documento presenta una descripción detallada de todos los aspectos involucrados en el desarrollo de este estudio, y se ecuentra dividido de la siguiente forma: Capı́tulo 1: Marco Teórico Se abarca la teorı́a relacionada con el problema y la solución planteada, destacando por 5 tópico, los diferentes enfoques que han sido previamente estudiados. Capı́tulo 2: Metodologı́a de la Solución Se presenta la metodologı́a general de la solución. Primero, se desarrolla el razonamiento que sustenta la solución propuesta. Seguidamente, se explica cada etapa de la metodologı́a, justificando el enfoque escogido. Por etapa, se presentan los detalles de implementación más relevantes, que dan origen al algoritmo desarrollado en este trabajo. Capı́tulo 3: Experimentos y Resultados Se presentan los experimentos llevados a cabo para evaluar el rendimiento de la solución propuesta. El propósito y caracterı́sticas de cada experimento son descritos. Luego, se presentan y discuten los resultados obtenidos. Conclusiones y Trabajos Futuros Las conclusiones del trabajo son presentadas, ası́ como algunas observaciones futuras. CAPÍTULO 1 MARCO TEÓRICO En este capı́tulo se describen los diferentes aspectos teóricos relacionadas con el problema y la solución planteada. Se abarcan los conceptos y métodos de procesamiento de imágenes mas relevantes para este trabajo, destacando los diferentes enfoques que han sido utilizados en el pasado. Ası́ mismo, se presentan las caracterı́sticas principales del software Endrov, para el cual fue implementada la solución como extensión o plug-in. 1.1. Endrov Endrov, es tanto una librerı́a como un programa de análisis y procesamiento de imágenes de código abierto, que se basa en el modelo de arquitectura de extensiones o plug-in architecture. La idea de un modelo de arquitectura de extensiones es la de proveer una estructura general y estandar de operaciones y tipos de datos, y permitir la adición de componentes de software externos (que son contruidos a través esta estructura), para agregar funcionalidades adicionales al software que se rige bajo este modelo. El diseño de Endrov se realizó haciendo fuerte énfasis en separar el código de la interfaz gráfica de los tipos de datos, filtros y otras extensiones para procesamiento de datos. La idea del programa es proveer una herramienta robusta para el análisis y procesamiento de imágenes que pueda cubrir las necesidades de aquellos laboratorios, grupos de investigación y cualquier otro tipo de usuario, que manipulen imágenes diariamente, [29]. Endrov surgió de la necesidad de un software avanzado de código abierto que permitiese procesar los complejos datos espacio-temporales presentes en imágenes de microscopio, utilizadas en la investigación biológica. Endrov, se encuentra implementada en Java, es portátil, y puede ser ejecutada localmente o como un applet, como se indica en [29]. Endrov, tiene también como objetivo mejorar las funcionalidades del software código abierto de análisis de imágenes ImageJ, proveyendo un diseño más moderno. Las deficiencias principales de ImageJ son: falta de soporte de meta- 7 datos, no existe soporte real de 5D, la arquitectura de extensiones es confusa, las vistas no pueden ser extendidas fácilmente, y el procesamiento de grandes conjuntos de imágenes es complicado, tal como se indica en [7]. Otros problemas que inspiraron la creación de Endrov fueron la ausencia de un formato de imagen estandarizado, y la dificultad de almacenar datos complejos en los formatos abiertos que existen actualmente. El grupo de desarrollo de Endrov creó el formato OST para manejar grandes conjuntos de imágenes. Este formato puede almacenar todo tipo de información, pero se encuentra optimizado para imágenes. Endrov fue desarrollado por el TBU Group del Instituto Karolinska en Suecia, y fue liberado oficialmente el 17 de Junio de 2009, bajo la licencia BSD. 1.2. Método del Valor Umbral Los métodos del valor umbral (MVU), mejor conocidos por su nombre en ingles: thresholding, son un conjunto de algoritmos para segmentar gráficos rasterizados, que permiten separar objetos presentes en una imagen del resto. Esta separación de objetos es usualmente representada a través de una imagen binaria, que se obtiene después de procesar la imagen original en escala de grises. Una imagen binaria es un tipo de imagen discreta, en la cual cada pixel tiene asignado uno de dos valores posibles (tı́picamente 1 ó 0). Cada valor indica si el pixel pertenece al primer o segundo plano (fondo) de la imagen original, respectivamente. Como se indica en [32], durante la ejecución de un método del valor umbral, se marcan pı́xeles individuales como pı́xeles objeto o pı́xeles de fondo, según corresponda. Asumiendo que los objetos en las imágenes son más brillantes que el fondo, un pixel se marca como pixel objeto si su valor de luminosidad (u otro valor unidimensional) es mayor que un valor umbral determinado, de otro modo se marca como pixel de fondo. Esta convención se denomina umbral por encima. Diferentes variantes incluyen: umbral por debajo, que es el opuesto al anterior; umbral por dentro, donde un pixel es marcado como objeto si su valor de comparación se encuentra entre dos umbrales; y umbral por fuera, que es el opuesto a umbral por dentro, según se explica en [19]. En las aplicaciones de procesamiento de imágenes donde el estudio se enfoca en objetos particulares contenidos en una imagen, los MVU se convierten en una herramienta sencilla para separar estos objetos del fondo, aunque no siempre precisa. En [18, p.146], se mencionan diversas aplicaciones en procesamiento de imágenes que involucran MVU, tales como: 8 análisis de imágenes de documentos, donde el objetivo es extraer caracteres, logos, contenido gráfico o notas musicales, entre otros; procesamiento de mapas, que se centra en encontrar lı́neas, leyendas y caracteres; procesamiento de escenas, donde se busca detectar un objetivo o blanco; e inspección de calidad de materiales, donde se desea delinear piezas defectuosas, entre muchos otros. El parámetro clave para los MVU es el valor umbral (o valores umbrales para los enfoques de umbral por dentro y umbral por fuera). El valor puede ser tanto calculado automáticamente, como establecido o ajustado manualmente. Los diferentes MVU pueden ser categorizados de acuerdo de la información que explotan. En [18, p.147], Sezgin y Sankur categorizan los MVU en seis grupos principales: métodos basados en histograma de formas, métodos basados en agrupamiento, métodos basados en entropı́a, métodos espaciales y métodos locales. En la Figura 1.1, se muestran dos imágenes: una en escala de grises y la otra, la imagen binaria obtenida a través de un método del valor umbral. (a) Imagen en escala de grises (b) Imagen binaria obtenida a través de un método del valor umbral Figura 1.1: Imagen en escala de grises antes y después de aplicar un método del valor umbral. Las imágenes fueron tomadas de [32] 1.3. Transformada de Distancia Una transformada de distancia o mapa de distancias es una representación de una imagen digital, en la cual a cada pixel de la imagen le corresponde un valor que indica la distancia entre ese pixel y el pixel más cercano que pertenezca al fondo de la imagen. Se calcula a partir 9 de una imagen binaria, que consista en pı́xeles de objeto y pı́xeles de fondo. La imagen que se obtiene corresponde a una especie de representación en escala de grises del primer plano de la imagen binaria (conformado por los objetos). El valor que corresponde a cada pixel, depende directamente de la función de distancia, que define el patrón de medición de distancia entre pı́xeles de la imagen. Existen diversas funciones de distancia tales como: Manhattan, tablero de ajedrez, Euclidiana, Chamfer 3-4 y Octogonal, [3, p.363]. Ası́ mismo, existen muchas otras funciones de distancia, normalmente derivadas de las anteriormente mencionadas. En la Figura 1.2, se muestra el resultado de aplicar diferentes funciones de distancia a una imagen que contiene un punto en el centro, rodeado por un fondo blanco. Figura 1.2: Distancias a partir de un punto para seis transformadas de distancia. Mientras más claro es el color, más larga es la distancia [3, p.365] 10 Como se indica en [6], las transformadas de distancia juegan un rol central en la comparación de imágenes binarias, particularmente aquellas resultantes de técnicas de detección de caracterı́sticas locales, tales como detección de contornos o detección de esquinas. Las transformadas de distancia pueden ser interpretadas, también, como topografı́as de islas, donde la etiqueta o valor de cada pixel indica la altura o profundidad de la región. De esta forma, se pueden detectar crestas y picos, que constituyen la base principal de metódos sencillos para encontrar el esqueleto topológico de objetos en imágenes, tal como se explica en [1, p.237]. Las transformadas de distancias son también herramientas muy útiles para el mejoramiento de la eficiencia de algoritmos de morfologı́a, tales como: reducción de contornos y expansión de contornos. 1.4. Skeletonization Un esqueleto topológico es una representación compacta y simple de un objeto, que consiste en una versión reducida o delgada del mismo, que es equidistante a sus bordes, y que preserva muchas de las caracterı́sticas topológicas y geométricas de la imagen original, tal como se explica en [28, 10, 22]. Por lo general, el esqueleto se define como el conjunto de los centros de los discos máximos contenidos en la imagen original, [10, 22]. Existen muchas otras definiciones diferentes, que dependen, principalmente, de la forma en que el esqueleto es generado. Independientemente de la definición que se adopte, si los puntos pertenecientes al esqueleto son calculados en relación con su distancia a los bordes originales del objeto, el esqueleto puede ser utilizado para reconstruir con exactitud la figura original. La figura 1.3 presenta el esqueleto de una silueta de caballo, y la imagen binaria a partir de la cual fue calculado el esqueleto. (a) Imagen Binaria (b) Esqueleto topológico Figura 1.3: Imagen binaria de una figura de caballo y su esqueleto. Imágenes tomadas de [10] Los esqueletos topológicos pueden ser categorizados en diferentes tipos. Telea et al, [22], describen tres tipos de esqueleto de acuerdo a la forma en que son calculados, tales como: 11 esqueleto por reducción morfológica, esqueleto por métodos geométricos y esqueleto por transformada de distancia. El método de reducción morfológica consiste en la reducción iterativa de los bordes del objeto, identificando y marcando, capa por capa, aquellos puntos cuya remoción no afecte la topologı́a del objeto. Estos métodos son sencillos, por lo general, aunque suelen requerir heurı́sticas complejas para asegurar la conectividad del esqueleto, como se indica en [22]. En [5] y [34], se describen dos enfoques paralelos eficientes para garantizar la conectividad de esqueletos producidos a través reducción morfológica. Los métodos geométricos se centran en calcular el diagrama de Voronoi de una representación poligonal de los bordes del objeto. El diagrama de Voronoi representa el eje medio de los bordes. Tal como se asegura en [22, p.251], estos métodos producen un esqueleto conectado y preciso, pero son muy complejos de implementar, ya que requieren una robusta discretización de los bordes, y son computacionalmente costosos. El tercer tipo comprende los métodos que calculan el esqueleto a partir de la transformada de distancia. El enfoque común consiste en encontrar los puntos cresta y conectarlos, [21, 2, 1]. Por lo general, estos métodos pueden garantizar que los puntos esqueletos encontrados sean precisos y acertados, pero no la conectividad del esqueleto, ni su completitud. El esqueleto topológico es una herramienta importante para la representación y reconocimiento de objetos, en diferentes áreas, tales como: visión artificial, análisis de imágenes, y procesamiento de imágenes digitales, incluyendo reconocimiento óptico de caracteres, reconocimiento de huellas digitales, inspección visual, reconocimiento de patrones, compresión de imágenes binarias y acoplamiento de proteı́nas, [17]. 1.5. Ajuste de formas El ajuste de formas (en inglés shape matching), es un problema central en los sistemas de información visual, visión artificial, reconocimiento de patrones y robótica, [26]. Consiste en identificar el área o contorno de una forma en especı́fico o de determinadas clases de formas en una imagen, y tiene un rol fundamental en la extracción de contenido en imágenes y en la recuperación de imágenes basada en contenido. Tal como explica Veltkamp en [25], el ajuste de formas se ocupa de la transformación de una forma determinada y de la medición de su similitud con respecto a otra forma, utilizando alguna medida de similitud o distancia entre formas. El concepto de forma es abstracto. La mayorı́a de los enfoques en ajuste de formas definen las formas de manera geométrica. Esta descripción geométrica puede consistir tanto de un 12 conjunto de puntos, curvas, superficies o sólidos, etc, como de un patrón geométrico, dispuesto de acuerdo a algún grupo de transformaciones geométricas, en particular transformaciones de semejanza (traslación, rotación y escala), tal como se indica en [25]. Por lo general, se utiliza un patrón geométrico de forma, llamado descriptor de forma, para representar la clase del objeto a ajustar. Existen diferentes tipos de descriptores de forma, que se diferencian de acuerdo al tipo de información que los define y a la naturaleza del problema, (ver sección 1.6). Se han desarrollado diferentes enfoques para el problema de ajuste de formas. Esta sección se centra en aquellos enfoques basados en geometrı́a computacional, dado que son los más relacionados con el enfoque seguido en este trabajo. La geometrı́a computacional consiste en buscar y analizar algoritmos eficientes para resolver problemas geométricos. En [26], Veltkamp y Hagedoorn mencionan diferentes enfoques de ajuste de formas tales como: poda de árboles, la transformada de Hough generalizada, el método de alineación, estadı́sticas, modelos deformables, relajación de etiquetas, descriptores de Fourier, la transformada por ondulas y redes neurales. Ası́ mismo, categorizan las técnicas de ajuste de forma en dos grupos principales: transformadas de imagen global y métodos de objetos globales. El grupo de transformadas de imagen global se refiere a las técnicas que “transforman la imagen de información de color, en el dominio espacial, a variación de color, en el dominio frecuencial”, [26]. Estos enfoques no representan la forma explı́citamente para el ajuste, sino que representan las transiciones de color o intensidad en la imagen. Esto hace imposible medir las diferencias entre dos imágenes en términos de formas, ası́ como comparar y ajustar una forma a una parte especı́fica de la imagen. Por otro lado, los métodos de objetos globales trabajan con áreas completas de los objetos o con los contornos, y pueden analizar secciones especı́ficas de la imagen, en vez de requerir el procesamiento de la imagen como un todo, tal como en las transformadas de imagen global. En estos métodos se requiere que los objetos de la imagen estén completamente segmentados. Algunos de estos métodos son: método de momentos, donde los objetos son descritos como un conjunto de momentos (posición, área, orientación, y otros parámetros) y se detecta la invariancia de momentos en los objetos; método de ajuste modal, donde se utilizan los bordes descritos con descriptores de Fourier; y método de curvatura de espacio escalado, donde se utiliza un espacio escalado y una parametrización del contorno de los objetos. Veltkamp describe en [25] diversos enfoques para llevar acabo un ajuste de formas, dados dos patrones de forma y una medida de similitud. Estos problemas son: 13 Ajuste computacional: Computa la disimilitud entre dos patrones de formas. Ajuste por decisión: • Para un umbral determinado, decidir si la disimilitud es más pequeña que el umbral. • Para un umbral determinado, decidir si existe una transformación tal que la disimilitud entre el patrón transformado y el otro patrón es menor que el umbral. Ajuste por optimización: Encuentra la transformación que minimiza las disimilitud entre el patrón transformado y otro patrón. Existe un enfoque de ajuste de formas muy estudiado, que sigue el enfoque de ajuste por optimización y se conoce como Modelos de Contornos Activos, en particular el modelo de snakes, el cual inspiró gran parte del enfoque de ajuste de formas presentado en este trabajo, (Ver sección 2.2.8). En [11], un snake es definido como un spline minimizador de energı́a, que es guiado por fuerzas de restricciones externas e influenciado por fuerzas internas de la imagen que lo empujan hacia elementos caracterı́sticos tales como: lı́neas y contornos. Se dice que los snakes son modelos de contornos activos, debido a que se pliegan a contornos cercanos y los localizan con precisión. El modelo de snakes se define como un spline continuo y controlado que es restringido por fuerzas internas y externas de la imagen, llamadas energı́as. La energı́a interna modela la resistencia del objeto a ser empujado por fuerzas externas hacia direcciones inconsistentes, de acuerdo a la información previa que se tiene sobre el objeto y la imagen, [24]. En este caso, la energı́a interna impone una restricción de suavidad a trozos (“piecewise smoothness constraint”, [11]). Esto significa que el contorno es empujado hacia elementos resaltantes de la imagen por las fuerzas externas, mientras que el contorno en si mismo exhibe resistencia a ser deformado en un curva no-suave. Como se explica en [24], las fuerzas de la imagen empujan al snake hacia salientes o caracterı́sticas resaltantes de la imagen como lı́neas, bordes y contornos subjetivos, mientras que las fuerzas externas de restricción son responsables por ubicar al snake cerca del mı́nimo local deseado.La formalización de estos conceptos se presenta a continuación. Sea M el modelo a deformar y D el conjunto de datos, la energı́a total, E, puede ser definida como: E(M, D) = Eext (M, D) + Eint (M, D) 14 donde Eext es la función de energı́a externa y Eint la función de energı́a interna. De esta manera, la técnica de optimización se centra en minimizar la función objetivo definida por la energı́a total. 1.6. Descriptores de Forma Un descriptor de forma es una abstracción estructurada de una clase de formas, que las describe de manera geométrica. Los descriptores de forma pueden ser tanto fijos como variables. Los descriptores fijos son aquellos que representan un conjunto previamente definido de formas, a manera de plantillas. Los descriptores variables definen una serie de parámetros para representar la forma. Dependiendo de los valores asignados a los diferentes parámetros, se obtienen diferentes variaciones de formas, que igualmente pertenecen al tipo o clase de formas representadas por el descriptor. Los descriptores o modelos de formas han sido ampliamente utilizados para interpretar de manera robusta objetos complejos, [23]. Latecki et al [9], separan los descriptores en tres categorı́as principales: Descriptores basados en contornos: El contorno de un objeto determinado es definido a través de a algún tipo de representación, a partir de la cual se deriva un descriptor de forma. Descriptores basados en imágenes: El cálculo del descriptor de forma se basa en agrupar el valor de los pı́xeles de una imagen digital que contiene la silueta del objeto, a partir de los cuales se construye un vector descriptivo de parámetros variables. Descriptores basados en el esqueleto topológico: Luego de que el esqueleto de la imagen es calculado, este es transformado a una estructura de árbol que conforma el descriptor de forma. La disimilitud entre formas es calculado a través de algún algoritmo de grafos. Considerando que, básicamente, los descriptores de forma son intentos de cuantificar una forma en términos fácilmente entendibles por la mente humana, [14, p.1], cualquier tipo de representación geométrica que cubra los elementos o propiedades que quieren ser descritos en una forma, puede ser usado como descriptor. En [14], se cubren los descriptores de forma basados en regiones. Estos son todos aquellos que describen una forma en base a las propiedades geométricas y numéricas de la región que ésta cubre. Algunos descriptores simples son mencionados, tales como: el área, el perı́metro, compactibilidad (no-compactibilidad), circularidad (no-circularidad), excentricidad, elongación, orientación y grado de similitud a un rectángulo. Cualesquiera combinaciones de estas propiedades de una forma son útiles para 15 describirla de manera básı́ca. Se mencionan tambı́en otras propiedades más complejas para mejorar la precisión del descriptor, como lo son: la envoltura convexa, puntos extremos, perfiles, momentos y perfil de momentos. La envoltura convexa mide la cantidad de concavidades que presenta la forma. El descriptor de puntos extremos se centra en encontrar los puntos lı́mite de una forma; esto puede ser, tanto una representación simple como el rectángulo delimitador, como una representación más poderosa, como lo es el encontrar los ocho puntos extremos de la figura, a saber: norte, nor-oeste, oeste, sur-oeste, y ası́ sucesivamente. El descriptor por perfiles, se basa en el número de pı́xeles que la forma presenta en una dirección determinada, ya sea vertical, horizontal o diagonal. El descriptor por momentos, se basa en el cálculo de momentos estadı́sticos, y el descriptor de perfil de momentos, es una combinación de los últimos dos. Un descriptor puede o no permitir la reconstrucción de la forma original que describe, dependiendo de las propiedades que controla y mide. En [23], se presenta un método entrenable para representación de formas, que permite capturar automáticamente las propiedades invariables de una clase de formas y proveer una descripción paramétrica compacta. Este método fue aplicado en gusanos, obteniendo un descriptor que reconstruye formas de gusanos con diferentes flexiones, dependiendo de los valores asignados a los parámetros que la definen. 1.7. Splines El término spline, como se utiliza en este trabajo, se refiere, en general, a una curva definida a trozos mediante polinomios. Los splines han sido ampliamente utilizados en los subcampos de las ciencias de la computación, por la simplicidad de su construcción, la facilidad y precisión de su evaluación, y su capacidad para aproximar formas o figuras complejas, como se explica en [31]. La representación de una curva continua es particularmente apropiada para problemas como: detección de contornos, ajuste de superficies y técnicas de multi-resolución. Es igualmente útil para muchos otros problemas en visión artificial como: flujo óptico, reconstrucción de superficies y recobramiento de iluminación y color, [12, 821]. Los splines reciben nombres diferentes dependiendo de diversas condiciones. Un tipo de spline, muy comúnmente utilizado en reconocimiento de objetos, es el spline de Hermite; este es un spline de tercer grado, que se expresa utilizando polinomios de Hermite, para representar cada una de las porciones individuales del polinomio. Diversos métodos han sido desarrollados para ajustar estos splines a un conjunto de puntos tales como: spline cardinal, splines de Catmull-Rom y splines de Kochanek-Bartels. Todos estos permiten construir 16 una curva suave que pasa por cada punto del conjunto. De esta manera, dados una serie de puntos que pertenecen, digamos, al contorno de un objeto, una figura suave puede ser calculada, que modele la forma definida por el objeto. Los splines de Hermite proveen una cantidad de ventajas que lo hacen útiles en el procesamiento de imágenes, como se menciona en [12]. Primero, los splines de Hermite son, por lo general, curvas suaves y que tienden muy poco a oscilar, al contrario de los polinomios de orden superior. Además, estos splines son continuos en todas partes; en contraste a los polinomios encontrados por aproximaciones locales. que puede producir discontinuidades fuertes en la conexión de regiones. Finalmente, tienen la ventaja de poder ser evaluados fácilmente. CAPÍTULO 2 METODOLOGÍA DE LA SOLUCIÓN En este capı́tulo se presenta la metodologı́a general de la solución, que consiste en los diferentes procesos que deben ser llevadas a cabo para detectar eficazmente la forma de gusanos C. elegans presentes en imágenes digitales. Primero, se desarrolla una descripción general de la metodologı́a, donde se justifica el diseño de la solución y se especifican los diferentes procesos involucrados. Luego, se explica cada proceso de manera individual, aclarando su respectiva utilidad y necesidad. Por cada proceso se presenta, además, las caracterı́sticas de su implementación en este trabajo, lo que da origen al algoritmo que aquı́ se provee. 2.1. Diseño de la Metodologı́a: Razonamiento Previo A continuación se presenta el razonamiento previo que condujo al diseño de la metodologı́a presentada en la sección 2.2 (la metodologı́a general es descrita gráficamente en la Figura 2.1). Como se explica en [15, 24, 25, 26], uno de los enfoques más comunes para el ajuste de formas consiste en adoptar un descriptor de forma, construir una silueta a partir del descriptor, y posicionar dicha silueta lo suficientemente cerca del objeto a ajustar en la imagen. Seguidamente, variar los valores de los parámetros del descriptor, deformando la silueta inicial, hasta que se logre una coincidencia aceptable entre la silueta generada y el objeto en la imagen. La utilización de un descriptor de forma suele ser apropiado cuando los objetos a ser ajustados pueden ser categorizados en un clase especı́fica, y pueden ser descritos en términos geométricos. El problema de estudio tiene como objetivo la detección y ajuste de gusanos, particularmente aquellos que pertenece a la especie C. elegans. Dado la propiedad vermiforme de estos individuos, los objetos a detectar pueden ser agrupados en una clase gusano, a la que pertenecerı́an aquellos objetos que cumplen con las propiedades geométricas de tener 18 una forma alargada, delgada y cilı́ndrica, en términos generales. Siguiendo esta idea, se puede definir un descriptor de forma que permita generar siluetas de gusanos. Este descriptor podrı́a estar representado por dos puntos extremos (los extremos del gusano) y un conjunto de valores de grosor a lo largo del eje medio que conecta dichos extremos. Luego, el problema quedarı́a reducido a encontrar cada par de puntos extremos de gusanos en la imagen, ubicar una silueta aproximada (construida a través del descriptor de forma) cerca del gusano a ajustar, y deformar la silueta hasta encontrar una coincidencia factible. Para este estudio, las imágenes de entrada consisten, básı́camente, en tomas de microscopio de un conjunto de gusanos agrupados en medio lı́quido. Las imágenes pueden contener algo de ruido, por ejemplo, sombras, burbujas de aguas o pequeños restos que no pertenecen a los gusanos, y que por tanto deben ser separados del resto de la imagen. La posición de cada gusano individual en la imagen es variable y puede ser distinguida en dos grandes grupos: agrupaciones de gusanos y gusanos aislados. Una agrupación de gusanos corresponde a un conjunto de gusanos que aparecen en la imagen solapándose entre sı́. De esta manera, cada gusano que pertenece a la agrupación está conectado con el resto de manera directa o indirecta, a través de solapamiento; o lo que es lo mismo, desde cada gusano en la agrupación, se puede trazar un camino hacia otro gusano sin pasar por pı́xeles de fondo. Por otro lado, los gusanos aislados, son aquellos que están rodeados por pı́xeles de fondo y que no se solapan con ningún otro gusano. Los diferentes gusanos aislados y agrupaciones de gusanos podrı́an ser separados fácilmente del resto de la imagen al identificar los diferentes caminos de esqueleto que solapan entre sı́, permitiendo ası́, procesar cada uno individualmente. El contorno de los gusanos aislados puede ser trazado siguiendo los pı́xeles del objeto que estan más cercanos a los pı́xeles de fondo. Habiendo ajustado las formas de gusanos aislados, éstas podrı́an utilizarse para generar un perfil de gusano, que definirı́a los valores generales para un descriptor de forma genérico. Esto permitirı́a describir la silueta que mejor se ajusta a todos los gusanos de la imagen, en general. Los gusanos que pertenecen a agrupaciones de gusanos, se podrı́an detectar individualmente, a través de un proceso de ajuste de siluetas como el mencionado al comienzo de esta sección. 2.2. Descripción de la Metodologı́a e Implementación A continuación se presenta una descripción general de los diferentes procesos que involucra la metodologı́a de ajuste de formas. Seguidamente cada uno de estos procesos es explicado a 19 fondo, y se presentan algunos detalles de implementación. 2.2.1. Descripción General La metodologı́a presenta un diseño general por etapas. Cada etapa presenta el tipo de información que se debe obtener a partir de información previamente calculada, independientemente de la implementación particular que se le de a cada proceso involucrado en la etapa. Por ejemplo, una etapa define la separación incial de los gusanos a través del cálculo de una imagen binaria a partir de la imagen original. Este proceso es independiente del método que se utilice para calcular la imagen binaria. De esta manera, se presenta una visión general de la solución, y ası́ diferentes algoritmos pueden ser desarrollados que se ajusten a esta metodologı́a. Se provee, además, un enfoque especı́fico de implementación por etapa, que da origen al algoritmo que fue implementado y probado en este trabajo. Siguiendo el razonamiento de la sección anterior, se diseñó una metodologı́a tomando en cuenta los aspectos principales del proceso de detección y ajuste de formas estudiado, a saber: identificación general de gusanos en la imagen, segmentación de gusanos, especificación del descriptor de forma de gusanos y optimización del ajuste de formas. A continuación, se describe la metodologı́a de la solución de forma general, y seguidamente se explica cada etapa de forma detallada. En la Figura 2.1 se presenta una descripción gráfica de la metodologı́a. Dada la imagen de entrada, el primer paso consiste en separar los pı́xeles que pertenecen a los objetos de estudio (gusanos) del resto de la imagen. Para esto, se utiliza algún método del valor umbral (MVU) que permita calcular una imagen binaria que separe pı́xeles de gusanos de los pı́xeles del fondo. Por lo general, este proceso no es completamente eficaz, y se obtiene algo de ruido en la imagen, el cual debe ser eliminado en procesamientos posteriores. Esta primera etapa corresponde a una segmentación inicial de la imagen de entrada. Seguidamente, a partir de la imagen binaria, se puede calcular una transformada de distancia o mapa de distancias, en la cual se almacena la distancia de cada pixel al pixel de fondo más cercano. La transformada de distancia hace posible identificar fácilmente los pı́xeles de contorno en la imagen binaria, lo que la convierte en una herramienta fundamental para la generación automática de perfiles de gusanos, el trazado de contornos en gusanos aislados y para la optimización del proceso de skeletonization, entre otros. Habiendo determinado los pı́xeles que pertenecen a gusanos en la imagen, se pueden separar los grupos de pı́xeles que están conectados y rodeados por pı́xeles de contorno. Esta segmen- 20 Imagen Entrada Inputde Image Imagen Binaria Gusanos Aislados Trazar Contorno Transf. Distancia Rasterización Descriptor de Forma Agrup. de gusanos Optimización Optimization Optimization Skeletonization Corrección Manual Figura 2.1: Descripción gráfica de la metodologı́a para detectar gusanos C. elegans en imágenes digitales 21 tación provee diversos grupos de pı́xeles objeto. Cada uno de estos grupos podrı́a ser tanto un gusano aislado como una agrupación de gusanos, de acuerdo a la diferenciación expuesta en la sección 2.1. Una manera de diferenciar los diferentes grupos es contando el número de extremos y de intersecciones. Un grupo que contiene exactamente dos puntos extremos y que no presenta intersecciones corresponderá a un gusano aislado. Por otro lado, si el grupo presenta más de dos puntos extremos, o al menos una intersección, esto indicará la presencia de solapamiento de gusanos, por tanto corresponderá a una agrupación de gusanos. El enfoque de ajuste de formas se centra en ubicar inicialmente una silueta de gusano genérica, cerca de un posible gusano en la imagen. De esta manera, es necesario poder determinar, con cierto grado de precisión y factibilidad, áreas que pertenezcan a gusanos individuales en la imagen. Para este propósito, el esqueleto topológico de la imagen proveerı́a un camino continuo a través del eje medio de los objetos inicialmente segmentados, conectando puntos extremos de gusanos. Al mismo tiempo, permitirı́a detectar gran cantidad de puntos extremos. Seguidamente, los diferentes grupos segmentados son procesados para detectar y ajustar la forma de los gusanos individuales que los conforman. Los dos tipos de grupos definidos (agrupaciones de gusanos y gusanos aislados), son procesados de forma diferente. Gusanos Aislados El contorno de la silueta de los gusanos aislados puede ser trazada fácilmente de la siguiente forma: se selecciona un pixel de contorno (indicado en el mapa de distancias) y se construye un camino siguiendo el pixel de contorno vecino en cada paso, hasta que se cierre el contorno. Luego, la silueta puede ser rasterizada construyendo una maya triangulada y, seguidamente, rasterizando cada triangulo por separado. Esto proveerı́a el conjunto de los pı́xeles que pertenecen a la forma del gusano, por lo que la forma quedarı́a ajustada. El ajuste preciso que se puede obtener de los gusanos aislados, hace posible calcular un perfil de gusano que represente a los individuos de la muestra, de forma general. De esta manera, se puede construir un descriptor de forma preciso (esto es explicado a fondo en la sección 2.2.6). Agrupaciones de Gusanos Para detectar los gusanos individuales presentes en una agrupación de gusanos, se calculan las formas de gusanos factibles entre cada par de puntos extremos y luego se determina cuáles de aquellas tienen más probabilidades de pertenecer a gusanos en la imagen. 22 El proceso en general es como sigue: dado un par de puntos extremos, se selecciona algún camino entre ellos. Luego, se escogen un conjunto de puntos de control y a partir de estos puntos y del descriptor de forma, se genera una silueta de gusano alrededor del camino. Dicho camino constituye el eje medio de la silueta generada. Después de esto, se lleva a cabo un proceso de ajuste de formas, que consiste en minimizar la distancia que existe entre la silueta generada y el gusano que presumiblemente se encuentra dispuesto en un espacio cercano al camino escogido, hasta que el mejor ajuste es encontrado. Una forma ajustada, después del proceso de minimización, se denomina conformación. Una conformación corresponde a la mejor silueta de gusano que se puede construir a partir de un camino entre dos extremos determinados, y que presumiblemente representa a un gusano real de la imagen. Este proceso es repetido para cada camino de gusanos factible que puede ser encontrado a partir de cada punto extremo. De esta manera, se obtienen todas las conformaciones posibles en la imagen. Luego, un algoritmo de asignación permitirá seleccionar el mejor conjunto de conformaciones, que maximice el número de puntos extremos cubiertos y minimice el valor acumulado de energı́a. Las conformaciones escogidas incorrectamente a través de la asignación automática, podrán ser corregidas siguiendo un sencillo proceso manual. Un algoritmo de predicción de caminos puede ser utilizado para encontrar los caminos de gusano más probables, que parten de un punto extremo dado. Las conformaciones resultantes de los caminos predichos por el algoritmo podrı́an ser beneficiados sobre otras conformaciones, para aumentar la probabilidad de que sean escogidos. En las secciones siguientes se cubren detalladamente los diferentes procesos involucrados en la metodologı́a presentada, y se presenta el enfoque particular de implementación seguido en este trabajo, para cada uno de ellos. 2.2.2. Segmentación Inicial (Método del Valor Umbral) Dado que el propósito principal de este estudio es detectar y ajustar la forma de gusanos C. elegans en imágenes digitales, un paso inicial fundamental es el de separar las formas de gusanos lo más posible del resto de la imagen, para ası́ poder llevar a cabo un análisis más preciso. Sean los gusanos en la imagen los objetos a separar y considerando el resto de la imagen como fondo o segundo plano, los pı́xeles de la imagen pueden ser separados en dos grupos: pı́xeles de objeto y pı́xeles de fondo. Dada esta caracterización, un método del valor umbral 23 permitirı́a separar los objetos en la imagen digital y descartar la información innecesaria, representando esta separación a través de una imagen binaria. La imagen binaria proveerı́a entonces una segmentación inicial de la imagen original, siendo además clave para el cálculo del mapa de distancias de la imagen, como se explica en la sección 2.2.3. En general, para esta etapa de la metodologı́a, cualquier MVU que permita obtener una imagen binaria que identifique satisfactoriamente los pı́xeles que pertenecen a los gusanos de la imagen, será suficiente para continuar el proceso normalmente, sin importar la existencia de ruido leve en la imagen. Implementación Existen cuatro MVU para imágenes en 2D implementados en Endrov, estos son: Fukunaga, máxima entropı́a, Otsu y percentil, que cubren las categorı́as de MVU basados en histogramas y MVU basados en entropı́a (ver sección 1.2). Dada la condición de transparencia de los gusanos C. elegans, es difı́cil determinar teóricamente cual vendrı́a a ser el método más apropiado para obtener una imagen binaria precisa. Por esta razón, se realizó una serie de experimentos para seleccionar el método más apropiado. Estos experimentos consistieron en el ajuste manual de los diferentes parámetros de cada uno de los métodos mencionados, que fueron aplicados sobre un conjunto de imágenes de prueba. La precisión de segmentación de las imágenes binarias obtenidas en cada caso, se midió a través de una comparación visual con la imagen original. El método que mejor se comportó en estos experimentos resulto ser el método del valor umbral por percentil, al ser el más fácil de ajustar manualmente y aquel que retornó el equivalente binario más preciso, en cada caso. Un análisis más detallado sobre la escogencia del método de valor umbral para esta metodologı́a se presenta en la sección de experimentos del capı́tulo 3. En la figura 2.2 se presenta una imagen binaria, obtenida al aplicar el método del valor umbral por percentil. 2.2.3. Transformada de Distancia La transformada de distancia de la imagen binaria es utilizada a fondo en el seguimiento de contorno y en diferentes tipos de procedimientos de segmentación. Especı́ficamente, el mapa de distancias permite detectar y delinear el contorno exacto de gusanos aislados (sección 2.2.8), es útil en la generación automática de perfiles de gusanos (sección 2.2.6), y es esencial en la predicción heurı́stica de caminos de gusanos más probables (sección 2.2.5). Ası́ mismo, permite mejorar el rendimiento del algoritmo iterativo de reducción de capas diseñado por 24 (a) Imagen original (b) Método del valor umbral por percentil. Valor=0.074 Figura 2.2: Gusanos en medio lı́quido. Imagen original e imagen binaria obtenida a través del método del valor umbral por percentil, con un percentil de 0.074 Zhang y Suen, [34], como se describe en la sección 2.2.4 Implementación Tal como se describe en [33, p.196], los algoritmos para calcular transformadas de distancia pueden ser categorizados en dos grandes clases: métodos iterativos y métodos secuenciales o recursivos. Los métodos iterativos son particularmente eficientes en computadoras de arreglos celulares dado que se pueden procesar todos los pı́xeles en paralelo en cada iteración. Por otro lado, los métodos secuenciales se ajustan mejor a computadoras convencionales, al evitar iteraciones por ser independientes del tamaño de los objetos. Tomando en cuenta los tipos de computadoras a la que tienen acceso la mayorı́a de las personas que trabajan en el procesamiento de imágenes digitales, los algoritmos secuenciales ofrecen un rendimiento mucho más eficiente que los iterativos. Por esta razón, se escogió un enfoque secuencial para calcular la transformada de distancia de las imágenes de entrada. Particularmente se utilizó el algoritmo de transformación de dos recorridos con vecindarios de 3x3, presentado en [33], que es tanto eficiente, como sencillo de implementar. En el trabajo antes mencionado, se describe un algoritmo para calcular el mapa de distancias de una imagen en formato de mapa de bits, que consiste en dos recorridos y una operación por pixel. La complejidad del algoritmo es O(N ), donde N es el tamaño del arre- 25 glo que contiene la imagen. En dicho trabajo se presenta, inicialmente, un pseudo-código para las métricas de distancia de Manhattan y tablero de ajedrez, [33, p.197]. Luego, la definición es extendida para mejorar la eficiencia de los cálculos requeridos para generar un mapa de distancias a través de la métrica de distancias euclidianas, [33, p.198]. Este algoritmo de dos recorridos, fue implementado utilizando las tres métricas de distancia mencionadas anteriormente. Esto permite realizar una análisis más amplio del comportamiento y precisión del proceso de ajuste de formas, al cambiar de una métrica a la otra. Esto es debido a que los mapas de distancia generados por diferentes métricas, representan a los objetos de maneras diferentes, y tienden a ser sensibles a cambios posicionales u otras propiedades. En [20, p.332] se asegura que las métricas de tablero de ajedrez y Manhattan son sensibles a las rotaciones de los objetos, mientras que la métrica Euclidiana permanece invariable ante estas rotaciones; sin embargo, es mucho más costosa de calcular. Dada la forma alargada y estrecha de los gusanos C. elegans, y los diferentes niveles de precisión que proveen dichas métricas de distancia, es difı́cil decidir cuál se ajusta mejor al problema de estudio, por lo que debe ser determinado experimentalmente. La Figura A.3, presente en el Apéndice A muestra una imagen binaria y tres mapas de distancia obtenidos a partir de una imagen que contiene, únicamente, un gusano aislado. 2.2.4. Skeletonization La skeletonization de la imagen corresponde al proceso de obtener un camino de pı́xeles conectado y delgado, que tienda al eje central o eje medio de los gusanos en la imagen. A este camino se le denomina esqueleto. Este es un proceso clave en el enfoque de detección presentado en este trabajo, tal como se enuncia inicialmente en la Sec 2.2. El esqueleto de la imagen hace posible identificar la cantidad de gusanos presentes, permite diferenciar y separar las agrupaciones de gusanos de los gusanos aislados, y más importante, provee caminos entre extremos de gusanos (que tienden al eje medio). Estos caminos son fundamentales en el proceso de ajuste de formas (ver Sec 2.2.5), pues proveen información acerca de la localización de los gusanos en la imagen, al constituir trayectorias a lo largo de las cuales podrı́an estar dispuestos gusanos en la imagen. Para los efectos de este trabajo, el algoritmo de skeletonization a ser seleccionado debe garantizar la conectividad de los puntos del esqueleto, i.e. cada punto del esqueleto debe estar conectado con al menos otro punto del mismo esqueleto. Ası́ mismo, el esqueleto debe ser tan delgado como sea posible (hasta un 1 pixel de grosor) para simplificar el procesamiento y análisis de caminos. 26 Existen diferentes métodos de skeletonization que consisten en encontrar los puntos cresta en el mapa de distancias y conectarlos, como se explica en [21, 2, 1]. El enfoque presentado en [21] fue seguido inicialmente para calcular un esqueleto de imagen delgado en un tiempo de ejecución muy corto. Pese a que el estudio garantiza que el algoritmo permite calcular, satisfactoriamente, esqueletos conectados de un pixel de grosor, éste resultó ser eficaz únicamente para los gusanos aislados. Los esqueletos obtenidos para agrupaciones de gusanos resultaron generalmente desconectados, de más de un pixel de grosor y poco precisos. Esto llevó a la utilización de un enfoque diferente. En [34] se presenta un algoritmo iterativo para calcular el esqueleto de una imagen binaria. El algoritmo consiste, básı́camente, en la remoción por capas de aquellos pı́xeles que, de acuerdo a determinados criterios, no pertenecen al esqueleto del objeto. El diseño del algoritmo está dirigido a computadoras con procesadores paralelos, de manera que se puedan ejecutar varias operaciones de pixel al mismo tiempo, y mejorar ası́ el rendimiento. Para evitar el requerimiento de utilizar computadores con procesadores paralelos, sin desmejorar el rendimiento significativamente, el algoritmo fue ligeramente modificado. Dicha modificación consiste en utilizar el mapa de distancias para descartar chequeo de pı́xeles que pertenecen a capas más profundas que la capa que está siendo reducida en un momento determinado. Esto toma ventaja de la naturaleza de los mapas de distancia, quienes, por definición, establecen capas de distancia entre los pı́xeles del objeto y el fondo de la imagen. De esta manera, las capas se definen por el valor que tiene cada pixel en el mapa de distancias. La primera capa corresponde a un valor de distancia de uno (1), la segunda un valor de dos (2) y ası́ sucesivamente. El algoritmo es presentado en 2.2.1. El algoritmo se ocupa bien de los gusanos que se solapan, al construir un camino que se aproxima bien al eje central de las figura, y resulta en un esqueleto totalmente conectado y delgado (mayoritariamente 1-pixel de grosor). En la Figura A.4 presente en el Apéndice A se muestra el esqueleto de un conjunto de gusanos. 2.2.5. Segmentación de Gusanos Dado que el objetivo es ajustar las formas de gusanos individuales, es necesario localizarlos en la imagen y separarlos lo más posible, i.e. segmentar la imagen. La segmentación de los objetos de estudio permite mejorar la eficiencia y precisión del proceso de ajuste de formas, al reducir el área a analizar, disminuyendo ası́ la cantidad de combinaciones diferentes que deben ser tomadas en cuenta. Una vez que se han identificado los puntos extremos, se pueden calcular los diferentes caminos que existen entre ellos a partir del esqueleto. A través del conjunto de puntos extremos y de la cantidad de caminos e intersecciones, se puede determinar 27 Algoritmo 2.2.1 skeletonization por reducción por capas pixelesObjeto ← obtenerP ixelesObjetoBinario() imagenT D ← calcularT ransf ormadaDistancia() indiceContorno ← 1 reducir = T rue while reducir do {eliminar pı́xeles del borde sur-este y pixel de esquina nor-oeste} for pixel in pixelesObjeto do if ImagenDT (pixel) > indiceContorno then {saltar iteración} else eliminarP ixel ← condicionSurEste(pixel) if eliminarP ixel then pixelesObjeto.eliminar(pixel) reducir ← T rue end if end if end for {eliminar pı́xeles del borde nor-oeste y pixel esquina sur-este} for pixel in pixelesObjeto do if imagenT D(pixel) > indiceContorno then {saltar iteracion} else eliminarP ixel ← condicionN orEste(pixel) if eliminarP ixel then pixelesObjeto.eliminar(pixel) reducir ← T rue end if end if end for end while return pixelesObjeto 28 el tipo de grupo de gusanos al que pertenece cada grupo de objetos segmentados, ya sean gusanos aislados o agrupaciones de gusanos. De esta manera, el proceso de ajuste de formas se puede llevar a cabo en cada grupo por separado. Otro proceso de segmentación que debe ser llevado a cabo es la identificación de caminos de gusanos individuales, tanto para gusanos aislados como para agrupaciones de gusanos. Estos son caminos que no tiene bifurcaciones y que comienzan y terminan en puntos extremos. El esqueleto de un gusano aislado determinado corresponde a un camino de este tipo, y es utilizado para dos procesos diferentes: encontrar el contorno del gusano aislado (ver sección 2.2.8) y generar un perfil de gusanos (ver sección 2.2.6). El perfil de gusanos permite definir una representación general de los gusanos en la imagen. De esta manera, a través del perfil y un camino entre dos extremos, se puede construir una silueta de gusano, que tiene como eje central al camino escogido. Con respecto a las agrupaciones de gusanos, se deben encontrar caminos de gusanos factibles entre pares de puntos extremos. Si un camino existe entre un par de puntos extremos, será posible generar una conformación de gusano válida a través del proceso de optimización. Estos caminos pueden ser escogidos, tanto calculando todas las combinaciones de caminos posibles entre pares de puntos extremos, como a través de un algoritmo de predicción de caminos probables, como el que se describe más adelante en esta sección. A continuación se presentan detalles de la implementación realizada de cada uno de los diferentes procesos previamente descritos en esta sección, relativos a la segmentación de gusanos. Puntos Extremos de Gusanos A partir del esqueleto calculado se pueden detectar puntos extremos de gusanos. Aquellos pı́xeles del esqueleto que están conectados (son vecinos) de dos o más pı́xeles se denominan pı́xeles de cuerpo. Estos pı́xeles de cuerpo pertenecen al esqueleto pero no son extremos. Por otro lado, los puntos extremos del esqueleto son aquellos que están conectados con un sólo pixel y pueden corresponder al extremo de un gusano, aunque no necesariamente. Dado que el algoritmo de skeletonization basado en reducción por capas no permite asegurar que los extremos identificados pertenezcan a extremos de gusanos en la imagen, se debe llevar a cabo un proceso de expansión del esqueleto, para alcanzar los puntos extremos reales. El algoritmo se fundamenta en estirar los extremos del esqueleto, siguiendo una dirección coherente, hasta alcanzar puntos de contorno que vendrı́an a representar los extremos 29 de los gusanos. El algoritmo de expansión utiliza la definición de vecino direccional, que se presenta en [21, p.334]. Un pixel D es vecino direccional de otro pixel P , si pertenece a la vecindad de P (8-vecindad ) y está localizado dentro de un rango de ± 45◦ de cambio de pendiente, con respecto a la orientación actual del camino recorrido hasta P . En la Figura 2.3 se presentan tres ejemplos de vecindades direccionales. El algoritmo consiste en seguir el mejor camino direccional, partiendo de cada punto extremo y expandiendo el esqueleto, hasta que un punto de contorno es encontrado. Vecino Direccional Camino de Esqueleto D D P D D P D P D D D Figura 2.3: Tres vecindades direccionales El algoritmo de expansión de esqueleto puede ser resumido en los siguientes pasos: Seleccionar un punto extremo. Encontrar el pixel de esqueleto anterior y calcular la vecindad direccional. Seleccionar el vecino direccional con el menor valor en el mapa de distancia y marcarlo como pixel de esqueleto. Si el vecino seleccionado no es un punto de contorno, repetir el proceso. Seguidamente se lleva a cabo un proceso de remoción de pı́xeles de objeto incorrectos, que consiste en eliminar aquellos esqueletos cuyo tamaño (en cantidad de pı́xeles) sea menor que un umbral determinado. Esto permite remover regiones ligeramente ruidosas, ası́ como puntos extremos incorrectos. Una vez que el esqueleto ha sido expandido satisfactoriamente, los puntos extremos del esqueleto son marcados como puntos extremos de gusanos. Es importante considerar que, en algunos casos, hay puntos extremos de gusanos que no pueden ser detectados a través del proceso previamente descrito; particularmente en imágenes con gran cantidad de gusanos, donde existe una alta posibilidad de que los solapamientos entre 30 gusanos oculten puntos extremos. Para solucionar esto, se puede llevar a cabo un proceso manual de adición de puntos extremos faltantes, como se explica en la sección 2.2.9. Segmentación en Grupos Habiendo detectado los puntos extremos de los diferentes grupos de esqueletos en la imagen, se puede identificar a qué tipo de grupo de gusano corresponde cada uno, ya sea a una agrupacion de gusanos o uno aislado. Esto se hace identificando los extremos de gusanos que estan unidos a través de un camino del esqueleto. Como se explicó previamente, los gusanos que se superponen son considerados parte de un objeto en común en la imagen binaria, por lo que los puntos extremos que pertenecen a los esqueletos de agrupaciones de gusanos se encuentran conectados a través de un camino del esqueleto. Basado en este razonamiento, se diseñó un algoritmo que detecta la cantidad de puntos extremos que son conectados a través de caminos de un determinado esqueleto, y determina el tipo de grupo de gusanos al cual pertenece. Aquellos esqueletos donde se conectan exactamente dos puntos extremos a través de uno y solo un camino, corresponden a gusanos aislados. Mientras que los esqueletos en donde se conectan más de dos puntos extremos, corresponden a agrupaciones de gusanos. Este procedimiento es descrito en los algoritmos 2.2.2 y 2.2.3. Algoritmo 2.2.2 Segmentación en grupos de gusanos listaP tsExt ← lista de puntos extremos indiceAgrupacion ← 0 for ptExtremo in listaP tsExt do if ptExtremo.visitado() then {saltar iteración} else indiceAgrupacion+ = 1 segmentarP orCaminos(ptExtremo, indiceAgrupacion) end if end for Predicción de Caminos Una agrupación de gusanos es definida por un esqueleto que conecta puntos extremos a través de caminos. Sin embargo, hasta esta etapa, se desconoce el par de puntos extremos que pertenecen a cada gusano en la imagen, y el mejor camino en el esqueleto que conecte a 31 Algoritmo 2.2.3 Seguimiento de (segmentarP orCaminos(ptActual, clusterCount) ) Entrada: ptActual Entrada: indiceAgrupacion if not ptActual.esP untoEsqueleto() then return else agregar(ptExtremo, indiceAgrupacion) end if {continuar siguimiento de camino} if ptActual.esP tExtremo() then marcarP tExtremoV isitado(ptActual) end if vecinos ← obtenerV ecindad() for v in vecinos do f ollowP ath(v, indiceAgrupacion) end for caminos para segmentación cada par, y que mejor represente el eje central de cada gusano respectivo. El algoritmo de optimización, cubierto en la sección 2.2.8, lleva a cabo un proceso de manipulación de siluetas para ajustar formas de gusanos en la imagen, dados dos puntos extremos y un camino que los conecte. Para calcular la forma de gusano más probable que parte de un punto extremo determinado, el algoritmo tendrı́a que probar cada camino posible que parte de dicho punto extremo y seleccionar el que mejor se ajuste, lo que tiende a traducirse en un alto costo en tiempo de ejecución. Con el fin de reducir el tiempo de ejecución del algoritmo de ajuste de formas, y ası́ mismo proveer un parámetro adicional para determinar la factibilidad de los caminos analizados, se desarrolló un algoritmo de predicción de caminos. En sı́ntesis, el algoritmo lleva a cabo una búsqueda heurı́stica para determinar aquellos caminos que tienen mayor probabilidad de representar a un gusano de la imagen. El algoritmo de predicción se basa en la idea de evitar caminos que tienden a describir conformaciones no-naturales de gusanos. Para esto es necesario identificar cambios abruptos en el camino y flexiones poco comunes o imposibles en gusanos. La idea desarrollada para lograr esto se centra en que cada paso siguiente que sea seleccionado, corresponda a la dirección más coherente con respecto al camino que ha sido trazado hasta ese momento. Más especı́ficamente, se escoge el conjunto S de los últimos N pasos trazados, y a partir de éste, se calcula la dirección más comúnmente seguida en esa porción del recorrido. 32 Una dificultad considerable que surge de este enfoque, es que el seguimiento del camino tiende a evitar centros de bifurcaciones. Una bifurcación ocurre cuando más de un camino diferente puede ser seguido a partir de un punto determinado. Dado que estas bifurcaciones son originadas por solapamiento de gusanos, el área de la bifurcación suele ser grande, y por tanto hay mayor cantidad de pı́xeles posibles a escoger como siguiente paso. Los centros de bifurcaciones son aquellos puntos que se ubican en la zona más céntrica de estas áreas, y por tanto se encuentran a una distancia normalmente similar de todos los caminos que se bifurcan. Para poder determinar con mayor precisión el camino más adecuado a seguir, el trazado del camino debe aproximarse a los centros de bifurcaciones. Sin embargo, siguiendo el enfoque presentado, estos centros se tienden a bordear, es decir se tiende a seguir los contornos de las áreas de bifurcaciones en vez de adentrarse. Por esta razón se desarrolló una heurı́stica, que permita al recorrido aproximarse a los centros de bifurcaciones y llevar ası́ a una decisión mejor informada. La heurı́stica consiste básı́camente en considerar el valor en el mapa de distancias del pixel elegible, multiplicado por un factor de equilibrio. De esta manera, la selección del pixel siguiente se basa en dos valores fundamentales: la cantidad de veces que ha sido escogida la dirección en la que se encuentra dicho pixel en los últimos N pasos, y el valor de la heurı́stica para ese pixel. Esto puede expresarse de la siguiente forma: Siguiente(p) = máx (valorDir(direccion(p, s), N ) + td(n) ∗ f actorH) s∈vecindad(p) donde p es el último pixel marcado, valorDir es una función que calcula la cantidad de veces que la dirección del pixel vecino s ha sido escogida, td es el mapa de distancia y f actorH es el factor heurı́stico que controla la influencia del mapa de distancia. El Algoritmo 2.2.4 presenta un pseudo-código para este enfoque de predicción de caminos de gusanos. 2.2.6. Descriptor de Forma Como se mencionó inicialmente en la sección 2.2, el enfoque metodológico diseñado se basa en la manipulación de siluetas de gusanos que se generan a partir de un descriptor de forma. La forma de un gusano puede ser descrita en términos geométricos como objetos alargados, delgados y cilı́ndricos. Dado que el proceso de skeletonization y la posterior segmentación de la imagen, hacen posible obtener caminos entre pares de extremos de gusanos, un descriptor de forma permitirı́a construir siluetas de gusanos a lo largo del eje central definido por el 33 Algoritmo 2.2.4 Pseudo código: Algoritmo de predicción de caminos listaP tsExtremos ← lista de puntos extremos longitud ← longitud estimada de gusanos multiplicada por un factor escalar for puntoExtremo in listaP tsExtremos do if alcanzado(puntoExtremo) then {saltar iteracion} end if marcarComoAlcanzado(puntoExtremo) camino ← lista vacia extremoAlcanzado ← F alse pixelActual ← puntoExtremo while not(extremoAlcanzado) and size(path) < longitud do pixelActual ← obtenerM ejorV ecino(pixelActual) actualizarArregloDirecciones(direccion(pixelActual)) camino.agregar(pixelActual) if esP untoExtremo(pixelActual) then extremoAlcanzado ← T rue end if end while end for camino, lo que servirı́a como parámetro de entrada para el algoritmo de ajuste de formas. El descriptor fue diseñado basándose en la idea de generar una silueta de gusano representativa alrededor del eje central. El descriptor consiste en dos elementos principales: un conjunto de puntos de control y un perfil de gusano. El conjunto de puntos de control está conformado por N puntos equidistantes a lo largo del eje central del gusano definido por el esqueleto, incluyendo los dos puntos extremos. Por su parte, el perfil de gusano define N valores de grosor que son asociados a cada punto control, respectivamente. El grosor de un punto control determinado representa el radio de la circunferencia que tiene como centro a dicho punto. De esta manera, seleccionando dos puntos en posiciones opuestas de la circunferencia de grosor de capa punto control, y uniendo luego estos puntos a través de una curva suave, se obtiene un contorno que modela la silueta del gusano, como se muestra en la Figura 2.4. Para obtener un contorno que represente una forma de gusano de manera precisa, la escogencia de los puntos opuestos en las circunferencias de grosor debe tomar en cuenta las flexiones del esqueleto. Dado que el contorno se construye de acuerdo al grosor de los puntos de control, las flexiones del gusano a representar ocurren en cada uno de los puntos de control. El grado de flexión de cada punto control se calcula como el ángulo que existe entre las rectas que conectan dicho punto, con el punto anterior y posterior, respectivamente. 34 70° 140° Figura 2.4: Construcción de una forma de gusano basada en un descriptor de forma Por cada punto control, se calcula la bisectriz del ángulo de flexión y luego se marcan los dos puntos opuestos donde se intersecan la bisectriz y la circunferencia de grosor. Al calcular una curva que pasa por todos estos puntos, se obtiene un contorno suave que modela una forma de gusano. Generar una curva suave alrededor de los puntos de control mejora la precisión de la forma descrita, en comparación con trazar lı́neas rectas que conecten los puntos de contorno. Esta representación permite modelar el contorno con más detalle, utilizando un cantidad considerablemente menor de puntos. La curva suave se obtiene calculando un spline cardinal (ver sección 1.7) dados los puntos contorno. El perfil de gusanos para un conjunto de puntos de control de tamaño determinado puede ser, tanto definido manualmente, como calculado automáticamente a partir de los gusanos aislados, como se explica en el siguiente punto. Generación Automática de Perfiles La forma de los gusanos aislados puede ser ajustada con precisión, siguiendo los puntos de contorno en el mapa de distancia, como se explica en la sección 2.2.8. Dado un conjunto de formas ajustadas de gusanos aislados y sus esqueletos respectivos, se puede generar un perfil de gusanos, midiendo el grosor de los puntos de control y calculando la media aritmética de cada uno. Para medir el grosor de cada punto control, se selecciona inicialmente un conjunto de N 35 puntos equidistantes que cubren el esqueleto de un gusano aislado determinado. Seguidamente, como se describe en la sección previa, se calculan las bisectrices de los ángulos que existen entre las rectas que conectan los puntos de control. A partir de cada punto control, se recorren los pı́xeles de la bisectriz hasta que un punto de contorno es encontrado. Este recorrido se hace en los dos sentidos, por lo que el proceso devuelve dos puntos de contorno. A continuación, se calcula la distancia Euclidiana que existe desde cada punto control hasta sus dos puntos opuestos respectivos, y se almacena el promedio de distancia. Al repetir este proceso para cada gusano aislado se genera un conjunto de perfiles de gusanos aislados, uno por cada gusano. A partir de este conjunto de perfiles, se calcula un perfil general encontrando la media aritmética de los valores de grosor por cada punto control. Para que el perfil sea lo más representativo posible, se descarta el 20 % de los gusanos más grandes y más pequeños. El valor de grosor para los puntos extremos, es decir, el primer y último punto en el conjunto de tamaño N , es cero, por lo que en los extremos solo se genera un punto de contorno, en vez de dos como en el resto de los puntos de control. Este proceso permite calcular entonces un perfil de grosor que define la distancia promedio de cada punto control a su punto de contorno más cercano, haciendo posible la generación de siluetas genéricas de gusano alrededor de cualquier esqueleto. 2.2.7. rasterización de Siluetas El enfoque de ajuste de formas se centra en minimizar la distancia entre siluetas generadas y las formas de gusanos en la imagen. Para medir esta distancia se debe conocer el área de la silueta que es deformada. El área de la silueta puede ser calculada a partir de su contorno. En términos del tipo de datos que aquı́ se manejan, el área consiste en el conjunto de pı́xeles que son cubiertos por la silueta, incluyendo los pı́xeles de contorno. El enfoque seguido para calcular el área consiste en dividir en triángulos el espacio definido por el contorno cerrado de la silueta y luego rasterizar cada triángulo por separado. El término rasterizar se refiere al proceso de transformar una imagen descrita en términos vectoriales en un conjunto de pı́xeles, de manera que pueda ser visualizada. La descomposición de un polı́gono en triángulos simples, es un problema clásı́co de computación gráfica. Diversas soluciones se han propuesto entre ellas: triangulación de Delaunay, triangulación de costo mı́nimo y método de ear clipping. 36 Implementación El método de ear clipping fue escogido por su capacidad para triangular polı́gonos cóncavos y su sencillez de implementación. Para convertir el contorno del gusano en un polı́gono, se transforma el spline que lo define en un conjunto discreto de puntos. Cada punto sucesivo es conectado a través de rectas, definiendo un polı́gono cerrado. Para que la representación poligonal no afecte la suavidad del contorno definido por el spline, se escogen los puntos discretos (pı́xeles) lo más cerca posible uno de otros. Seguidamente el contorno poligonal es triangulado. Cada triángulo es rasterizado siguiendo el algoritmo de rasterización por barrido explicado en [13]. El algoritmo consiste en rasterizar lı́neas horizontales entre los lados del triangulo hasta que el área es cubierta por completo. Una vez rasterizados, se pueden almacenar el área y el contorno de la silueta en forma de datos manejables y visualizables. 2.2.8. Detección y Ajuste de Formas Una vez que la imagen ha sido segmentada en diferentes grupos de gusanos, y luego de calculado el esqueleto que representa el eje central de dichos grupos y un perfil general de los gusanos en la imagen, se puede llevar a cabo el proceso de ajuste de formas. Este proceso permite detectar los gusanos individuales que componen los diferentes grupos y almacenar sus formas respectivas en forma de datos manejables y visualizables. El proceso de detección y ajuste es diferente para cada tipo de grupos de gusanos, gusanos aislados y agrupaciones de gusanos. En esta sección se explican las caracterı́sticas de este proceso en cada caso. Ajuste de Formas en Gusanos Aislados En esta etapa de la metodologı́a, se conocen los diferentes gusanos aislados y se tiene, por cada uno, un esqueleto delgado que conecta dos puntos extremos de gusano a través de un camino. Dado que este proceso es llevado a cabo después de que cada punto extremo ha sido identificado correctamente y se conoce que el esqueleto no tiene bifurcaciones, el área conformada por los pı́xeles objeto del grupo segmentado corresponderán a la forma exacta del gusano aislado en la imagen. 37 Con el propósito de tener una información más amplia acerca de los gusanos detectados, se calcula también el contorno a partir del área previamente identificada. El contorno es trazado encontrando el pixel de borde más cercano a algún punto extremo del gusano y recorriendo cada pixel de contorno vecino hasta cerrar el camino. Un pixel de contorno es aquel que tiene el valor de uno en el mapa de distancias. Este proceso permite, entonces, obtener el contorno y el área de cada gusano aislado en la imagen, de manera precisa. Ajuste de formas en Agrupaciones de Gusanos Las agrupaciones de gusanos representan un escenario de detección más complicado, debido a la cantidad variable de gusanos que los conforman y el solapamiento entre éstos. El solapamiento entre gusanos hace difı́cil diferenciar el conjunto de pı́xeles que pertenecen al área de un gusano u otro. Por esta razón, se diseñó un proceso de ajuste de formas que se encarga de calcular las conformaciones o formas de gusanos factibles que parten de cada punto extremo, para luego determinar el conjunto de conformaciones que mejor ajustan la agrupación de gusanos como un todo. El ajuste de formas sigue un enfoque de optimización basado en la minimización de distancias entre gusanos de la agrupación y siluetas genéricas, que son deformadas para ajustarse a ella. Por lo tanto, una conformación de gusano es obtenida cuando la disimilitud entre una silueta deformada y un área determinada de la agrupación, es la mı́nima posible. A continuación, se describen los pasos y caracterı́sticas principales de este proceso: Por cada punto extremo se calcula el conjunto de caminos del esqueleto factibles que comienzan en ese extremo. Dado un camino del esqueleto, se construye una silueta genérica a través del descriptor de forma y el perfil de gusanos en la imagen. La silueta es dispuesta a lo largo del camino. Un proceso de optimización se encarga de deformar la silueta hasta que la disimilitud (distancia) entre dicha silueta y la imagen binaria sea minimizada. Una vez optimizada, la silueta corresponderá a una conformación de gusano factible. Una vez que se han calculado todas las posibles conformaciones que parten de cada punto extremo, se selecciona el conjunto de conformaciones que maximiza el número 38 de puntos extremos cubiertos y minimiza el valor de distancia acumulado. Las conformaciones seleccionadas corresponden a los mejores ajustes que se pueden obtener de forma automática. Las conformaciones escogidas que no representan a un gusano real en la imagen (conformaciones incorrectas) pueden ser corregidas a través de un sencillo proceso manual. Deformación de Siluetas Los caminos del esqueleto que son calculados (que van de un punto extremo a otro), corresponden a aproximaciones de posibles esqueletos de gusanos en la imagen. Dado que el modelo a deformar se construye sobre un camino del esqueleto (que tiende al eje medio de un área de la agrupación de gusanos), la silueta generada inicialmente se encontrará siempre cerca de una forma de gusano real. Dado esto, a través de perturbaciones simples y ligeras de la silueta generada, se podrá deformar el modelo lo suficiente como para corregir la desviación del esqueleto con respecto al eje central real del gusano a ajustar. De esta manera, se permite obtener la forma de gusano mejor aproximada que se puede calcular a partir del camino dado. La deformación de la silueta se hace a través del descriptor de forma, que se encuentra definido por un conjunto de puntos de control. Con el objetivo de proveer formas de gusano factibles y para limitar la cantidad de deformaciones posibles, una deformación consistirá en el reposicionamiento de un punto control. La cantidad de posiciones diferentes que un punto control puede tomar es fija, y se disponen a lo largo de la bisectriz del ángulo del punto control. Este ángulo depende, a su vez, de la posición de los otros puntos de control. Siguiendo esto, se puede obtener un gran conjunto de deformaciones posibles de forma rápida. Funcional de Energı́a La función de distancia debe proveer una medida de qué tan bien se aproxima la silueta que se deforma a un gusano en la imagen, es decir, qué tan bien se ajusta la forma deformada. Para definir esta medida de distancia se utilizó el concepto de funcional de energı́a, tal como se define en el modelo de contornos activos, [11]. El funcional de energı́a describe la distancia entre el modelo que se deforma y la imagen, guiando el proceso de ajuste de contornos. De esta manera, mientras menor sea el valor devuelto por el funcional de energı́a, menor es la distancia y por tanto mejor se ajusta el modelo. El funcional es formulado en base a dos conceptos: la energı́a externa y la energı́a interna. La suma de los valores de la energı́a externa e interna relativas a un modelo, constituye el 39 valor de energı́a para ese modelo especı́fico. La energı́a externa describe qué tan bien se ajusta el modelo deformado a la imagen. Conociendo que, mientras mayor es la cantidad de pı́xeles de fondo que son cubiertos por el modelo, más alejado se encuentra el modelo de un gusano en una agrupación; una medida apropiada para la energı́a interna serı́a la proporción de pı́xeles de fondo que son cubiertos por el modelo deformado. De esta manera, mientras mayor es la cantidad de pı́xeles de objeto que son cubiertos, menor es el valor de la energı́a externa. Por lo tanto, dado un modelo M y la funciones bg y f g que miden la cantidad de pı́xeles de fondo y de objeto que cubre el modelo, respectivamente, se puede definir la energı́a externa para este problema de la siguiente forma: Eext (M ) = bg(M ) bg(M ) + f g(M ) Otra posibilidad consistirı́a en tomar en cuenta, únicamente, la cantidad de pı́xeles de fondo. Sin embargo, dada la variabilidad de la cantidad de pı́xeles que puede cubrir una silueta de gusano, esta medida causarı́a a la energı́a externa ser muy variable de una silueta a otra. La energı́a interna modela la resistencia de la silueta (modelo) a perder, a través de la deformación, las caracterı́sticas que la hacen representar a la clase que modela, por ejemplo, la clase de gusanos. Esto significa que, para el problema que aquı́ se aborda, la energı́a interna modeları́a la resistencia de la silueta de gusano a ser deformada de manera tal que dejase de ser representativa de un gusano. Como se explica en [11], la energı́a interna funciona como una restricción de suavidad de los contornos del modelo y se formula explı́citamente (normalmente en términos diferenciales). Sin embargo, en el enfoque propuesto en este trabajo, cada silueta a deformar se genera a partir de un perfil de gusano ajustado a un descriptor de forma, por lo que cada silueta generada pertenece inequı́vocamente a la clase de siluetas de gusano. Por esta razón no es necesario incluir la energı́a interna en el funcional de energı́a. Optimización A través del proceso de optimización se desean obtener las conformaciones de gusanos factibles dentro de una agrupación de gusano. El enfoque general se basa en producir siluetas genéricas a partir de los caminos del esqueleto que conectan puntos extremos de gusanos, y deformarlas levemente de manera que se ajusten a la imagen lo mejor posible. Una vez que se tiene un descriptor de formas basado en el esqueleto (sección 2.2.6), un método de deformación de siluetas (sección 2.2.8) y una función objetivo que modele la distancia entre las siluetas y la agrupación a ajustar (sección 2.2.8), sólo basta escoger un método de opti- 40 mización. De acuerdo al enfoque que aquı́ se presenta, se puede utilizar cualquier método de optimización que permita minimizar la función objetivo que define la distancia entre formas de gusanos, a partir de una solución factible inicial, que, a su vez, permite generar otras soluciones factibles a través de un método de deformación. Dado lo rápido que se pueden calcular grandes conjuntos de deformaciones, de acuerdo al enfoque presentado en la sección 2.2.8, se escogió una meta heurı́stica de búsqueda local como método de optimización. El proceso en general consiste en obtener el mejor individuo de la vecindad que mejore el valor del funcional de energı́a, hasta que la función sea minimizada. La vecindad es calculada de la siguiente manera: Para una silueta determinada, se efectúan cuatro deformaciones diferentes por cada punto control. Particularmente, dos en cada una de las dos direcciones opuestas de la bisectriz del punto control. Existen entonces (N − 2) ∗ 4 deformaciones posibles (vecinos) por cada silueta 1 , donde N es el número de puntos de control. De esta manera, una vecindad consiste en deformaciones leves y ligeramente más fuertes de una silueta de gusano para cada punto control. Los puntos de control que corresponden a los extremos del esqueleto permanecen fijos. Una vez que la mejor silueta es obtenida, se lleva a cabo un proceso de corrección de contornos. Este proceso consiste en la expansión o contracción de determinadas secciones del contorno de la silueta, para adaptarla al gusano real de la imagen. Esto es requerido dado que la silueta optimizada es generada inicialmente siguiendo un perfil de gusano, el cual representa la forma de los gusanos de una manera genérica, y por tanto no describe las formas exactas de los gusanos en la imagen. En este proceso, los puntos de contorno construidos a partir de los puntos de control son empujados hacia puntos de contorno de la imagen, de acuerdo al mapa de distancias, ya sea expandiéndolos o contrayéndolos. Cada posición nueva considerable para el punto contorno debe poseer un valor en el mapa de distancia similar o menor al que poseı́a originalmente. Selección de Conformaciones Después que el proceso de optimización es llevado a cabo, se debe seleccionar un subconjunto de conformaciones por cada agrupación de gusano, que representará la asignación final de conformaciones y por tanto la solución encontrada al final del proceso. El subconjunto 1 Los puntos de control que corresponden a los extremos permanecen fijos. Por eso el número de puntos de control tomados en cuenta es N − 2 41 seleccionado debe maximizar la cantidad de puntos extremos cubiertos y minimizar la suma de las energı́as finales de cada conformación (valor minimizado de la función objetivo). Cada punto extremo debe corresponder como máximo a una conformación. De esta manera, a cada punto extremo le corresponde uno y sólo uno de los otros puntos extremos. Por consiguiente, el subconjunto óptimo de conformaciones corresponderá a la asignación de costo mı́nimo (energı́a de cada conformación) entre el conjunto de puntos extremos, por cada agrupación de gusano. Esta asignación puede resolverse con el problema de asignación de costo mı́nimo de un grafo no-bipartito. Sin embargo, dada la complejidad de de este problema (NP-difı́cil) y su posible sobrecarga en rendimiento en el caso de una implementación poco eficiente, se diseñó una solución diferente, consistiendo en un algoritmo greedy iterativo. El algoritmo es aplicado a subgrupos de agrupaciones de gusanos. Estos sub grupos están comprendidos, únicamente, por puntos extremos conectados por caminos factibles. Los puntos extremos que pertenecen a subgrupos serán llamados puntos conflictivos. El algoritmo consiste en lo siguiente: Dado N puntos extremos conflictivos, se construye una tabla de N xN en la que cada elemento de la tabla almacena el costo de la mejor conformación que puede ser obtenida a partir de un camino de esqueleto entre cada par de puntos extremos. Luego, para la fila de valores de un punto extremo inicial, se selecciona el mı́nimo valor y se realiza una asignación entre el punto de la fila y correspondiente punto de la columna (siempre puntos diferentes). A partir de aquı́, se elimina el resto de las conformaciones asociadas a estos puntos extremos. Seguidamente, se repite el proceso entre las filas restantes hasta que se ha asigando una conformación a cada fila, o hasta que no existan mas posibilidades, momento en el cual se ha encontrado una asignación. Esta asignación es almacenada en memoria, se reconstruye la tabla previa, y se repite el proceso nuevamente a partir de una fila diferente, hasta que todas las filas han sido tomadas como filas iniciales. De todas las soluciones encontradas en cada iteración, se escoge aquella que cubre el mayor número de puntos extremos y que posee el menor valor acumulado de energı́a. 2.2.9. Corrección Manual Un proceso de corrección manual puede ser llevado a cabo para mejorar la efectividad de la detección y ajuste de formas, permitiendo tanto agregar puntos extremos no identificados como corregir conformaciones incorrectas. 42 Corrección de Puntos Extremos Los puntos extremos de gusanos son detectados inicialmente a través de la identificación de extremos del esqueleto de la imagen. Sin embargo, cuando el extremo de un gusano determinado se superpone con otra forma de gusano, la figura que describen se vuelve continua en la imagen binaria, por lo que será descrito como un camino continuo en el esqueleto. De ser ası́, el punto extremo no podrá ser detectado. Dado que el proceso de ajuste de formas está fundamentado en los caminos encontrados entre puntos extremos de gusanos, el hecho de obviar puntos extremos podrı́a afectar la efectividad de detección. Los puntos extremos de gusanos pueden ser detectados fácilmente por el ojo humano, especialmente teniendo el esqueleto del grupo de gusanos. Por esta razón, los puntos obviados pueden ser agregados rápidamente, a través de un proceso manual. El proceso consiste básicamente en observar los puntos que han sido agregados, inferir los puntos faltantes y agregarlos manualmente, por ejemplo, pulsando con el ratón de computadora en el pixel de la imagen que se muestra en la ventana de Endrov. Cuando un punto añadido posee más de un esqueleto vecino, el usuario tendrá que remover el pixel adicional, para cumplir con la definición de punto extremo. En resumen, el usuario puede agregar los puntos extremos faltantes, seleccionando dicho pixel. En algunos casos, tendrá que seleccionar un pixel vecino para desconectarlo de caminos incorrectos. Corrección de Conformaciones En caso de que algunas de las conformaciones asignadas no sean correctas, la solución puede corregirse de manera manual. Dado que en el proceso de optimización son calculadas todas las posibles conformaciones entre pares de puntos extremos, la corrección de asignaciones incorrectas se reduce a seleccionar el par de puntos extremos correctos. Un usuario no experimentado es capaz de reconocer las asignaciones incorrectas con facilidad, ası́ como los puntos extremos que éstas conectan, por lo que el proceso tenderá a ser rápido. CAPÍTULO 3 EXPERIMENTOS Y RESULTADOS En este capı́tulo se presentan los diferentes experimentos llevados a cabo para probar el rendimiento de la solución de detección y ajuste de formas desarrollada, explicando la razón de su elección y los diferentes objetivos de las pruebas. Seguidamente, se presentan y discuten los resultados obtenidos a partir de los experimentos, donde se indican las ventajas e inconvenientes de la solución presentada. 3.1. Experimentos Con el objetivo de poner a prueba la solución implementada, se utilizaron tres imágenes digitales de gusanos en medio lı́quido, provistas por Johan Henriksson, investigador del Departamento de Biociencias y Nutrición del Instituto Karolinska en Suecia. A cada imagen le corresponde un nivel de dificultad diferente, asignado de acuerdo al número de gusanos y grado de solapamiento. Ası́, mientras mayor es la cantidad de gusanos en la imagen, y mientras mayor es la cantidad de gusanos que se superponen, mayor es el nivel de dificultad. El grado de solapamiento se determina por el número de gusanos que pertenecen a las diferentes agrupaciones de gusanos, y por la cantidad de gusanos en la imagen. Las imágenes seleccionadas fueron denominadas: imagen de prueba 1, imagen de prueba 2 e imagen de prueba 3, y se presentan en la Figura 3.1. 44 (a) Imagen de Prueba 1 (b) Imagen de Prueba 2 (c) Imagen de Prueba 3 Figura 3.1: Conjunto de imágenes de prueba Las caracterı́sticas del conjunto de prueba se muestran en la tabla 3.1, donde las diferentes pruebas aparecen en orden creciente de dificultad. Tabla 3.1: Caracterı́sticas del conjunto de prueba Imagen Número de Gusanos Aislados Número de Agrupaciones Test 1 Test 2 Test 3 11/19 (57.8 %) 8/33 (24.2 %) 13/38 (34.2 %) 3 3 5 Número de Gusanos en Agrupaciones 8/19 (42.1 %) 25/33 (75.7 %) 25/38 (65.7 %) Total de Gusanos 19 33 38 Por cada imagen de prueba se llevó a cabo una serie de experimentos, para analizar el rendimiento de los diferentes procesos involucrados en la metodologı́a de la solución, en base a la implementación desarrollada. El proceso global fue dividido en tres etapas que representan los pasos fundamentales de la metodologı́a: procesamiento inicial, detección y ajuste automático de formas y correción manual. La etapa de procesamiento inicial involucra todos los pasos de procesamiento de imágenes que son realizados antes del proceso de optimización, tales como: segmentación inicial, transformación por distancia, skeletonization, agrupamiento de gusanos, detección de puntos extremos y creación del perfil de gusanos. Entre estos, la transformación por distancia y la skeletonization siguen algoritmos previamente analizados y probados, (ver Sec. 2.2.3 y Sec. 2.2.4) y producen resultados sencillos de probar, por lo que no hay necesidad de ahondar en 45 ellos. El proceso de segmentación y agrupamiento de gusanos, que se deriva del esqueleto de la imagen, es igualmente sencillo. Por otro lado, los procesos de segmentación inicial por un método del valor umbral, detección de puntos extremos y generación de perfiles dependen de las caracterı́sticas de la imagen de entrada, por lo cual se llevaron a cabo diferentes experimentos para analizar su rendimiento. La etapa de detección y ajuste de formas consiste en un serie de experimentos que tratan del proceso automático de optimización para ajustar formas en agrupaciones de gusanos y gusanos aislados. Estos experimentos buscan medir la eficacia en la detección y la eficiencia en tiempo de diferentes variaciones del proceso de ajuste de formas, con el propósito de sacar conclusiones más detalladas acerca de la eficacia del algoritmo y la factibilidad de la solución automática. La tercera etapa, corrección manual, tiene como objetivo medir el tipo y cantidad de correcciones manuales que deben ser llevadas a cabo por el usuario para corregir conformaciones incorrectas, en cada imagen de prueba. Se analizan, ası́ mismo, las diferencias entre las diferentes conformaciones factibles por cada punto extremo, para obtener conclusiones acerca de la sensibilidad del funcional de energı́a. Los experimentos fueron ejecutados en una computadora personal de 2.00 Ghz AMD Turion, Procesador Mobile Dual-Core, 1MB cache y 3Gb de memoria RAM, bajo Linux, distribución Ubuntu, utilizando el software Endrov. 3.2. Resultados En esta sección se presentan y discuten los resultados obtenidos de los experimentos realizados. Los resultados son distribuidos en tres etapas de acuerdo a los experimentos llevados a cabo: procesamiento inicial, detección y ajuste de formas y correción manual. 3.2.1. Procesamiento Inicial En esta sección se presentan los resultados para los siguientes procesos: segmentación inicial y detección de puntos extremos. Seguidamente, se presenta una breve discusión sobre la generación de perfiles de gusanos. 46 Segmentación Inicial (Método del Valor Umbral) Como se explica en la Sec. 2.2.2, Endrov provee implementaciones para los siguientes MVU: Fukunaga, máxima entropı́a, Otsu y percentil. Con la intención de determinar el método más apropiado, se probaron los diferentes métodos con el conjunto de prueba. La prueba por método consistió, básı́camente, en ajustar los parámetros de entrada hasta encontrar la mejor imagen binaria posible, a partir de cada imagen del conjunto de prueba. La determinación de la calidad de cada imagen binaria se llevó a cabo a través de inspección visual. En la Figura A.5 presentada en el Apéndice A, se muestran las mejores imágenes binarias que se obtuvieron a partir de la imagen de prueba 2, aplicando cada uno de los métodos mencionados anteriormente. El método del valor umbral por percentil resultó ser el mejor para las tres imágenes del conjunto de prueba, con gran diferencia sobre el resto de los métodos. Además, los mejores valores de percentil por imagen resultaron bastante cercanos entre sı́, lo que indica la posible factibilidad de ajustar un método de valor umbral automático para imágenes del mismo tipo, que es susceptible de ser desarrollado en trabajos futuros. Los mejores valores de percentil por imagen son mostrados en la Tabla. 3.2. El método de Fukunaga produjo resultados aceptables a partir de la combinación de imágenes binarias generadas con diferentes número de clases (parámetro del método), sin embargo requiere en general un ajuste más minucioso y produjo resultados menos precisos que el método de percentil. Tabla 3.2: Mejor valor de percentil para el conjunto de prueba Percentil Imagen 1 0.074 Imagen 2 0.1 Imagen 3 0.11 Los mejores valores de percentil oscilaron entre 0,074 y 0,11 y fueron sencillos de determinar utilizando Endrov. Detección de Puntos Extremos La tabla 3.3 muestra el número de puntos extremos que fueron detectados automáticamente y aquellos que se agregaron de forma manual, ası́ como el total de puntos extremos de gusanos en la imagen. 47 Tabla 3.3: Detección y ajuste de puntos extremos de gusanos en el conjunto de prueba Imagen Imagen 1 Imagen 2 Imagen 3 Total de Puntos Extremos 38 66 76 Puntos Detectados 38 (100 %) 53 (80 %) 57 (75 %) Puntos Agregados Manualmente 0 13 19 Considerando la alta cantidad de gusanos que pertenecen a agrupaciones de gusanos para la segunda y tercera imagen de prueba, y el bajo número de agrupaciones de gusanos (que aumenta el riesgo de solapamiento), la cantidad de puntos extremos no detectados puede ser considerada suficientemente baja, siendo ası́ factible agregarlos a mano. Perfiles de Gusano Para generar automáticamente un perfil de gusano preciso y representativo de los gusanos de la imagen que se procesa, es necesario que haya presencia de gusanos aislados. El porcentaje de gusanos aislados para cada imagen del conjunto de prueba fue de 57,8 %, 24,2 % y 34,2 %, respectivamente, oscilando entre 8 y 13 gusanos por imagen, como se muestra en la tabla 3.1. Los perfiles de gusanos generados en cada imagen del conjunto de prueba, permitieron conducir exitosamente el proceso de optimización de ajuste de formas para el conjunto de prueba, cuyos resultados son presentados en las subsecciones de nombre ajuste automático de formas, mostradas más adelante. 3.2.2. Detección y Ajuste de Formas En esta sección se presentan los resultados de la segunda y tercera etapa general de la metodologı́a de la solución, para cada imagen de prueba. Estas etapas consisten en la detección y ajuste automático de formas y en los procesos de corrección manual, tal como fueron descritas en la Sec. 3.1. En la sección de detección y ajuste automático de formas se presentan los resultados para cuatro variantes del algoritmo de detección y ajuste de formas, diferenciando la precisión del ajuste y el rendimiento en tiempo. Las dos variantes principales son denominadas: predicción y multicamino. 48 Predicción, es una versión del algoritmo en la cual se toman en cuenta los caminos calculados a través del algoritmo de predicción de caminos, presentado en la Sec. 2.2.5. Los caminos más probables que parten de cada punto extremo son favorecidos, disminuyendo por un factor el valor de distancia de las conformaciones encontradas a partir de estos caminos, de manera que aumente la probabilidad de ser escogidos en la asignación final. Por su parte, la variante multicamino no favorece a los caminos inducidos por predicción, y toma en cuenta todos los caminos posibles. Cada variante es probada agregando y sin agregar los puntos extremos faltantes, lo que constituye las cuatro variantes mencionadas inicialmente. El tiempo de ejecución que se muestra por cada variante corresponde al promedio de 500 corridas del algoritmo. La sección de corrección manual presenta los resultados obtenidos al llevar a cabo la modificación manual de las conformaciones incorrectas. Por cada prueba, se muestran la imagen resultante del ajuste automático, y la imagen resultante de la corrección, donde se resaltan las conformaciones que fueron corregidas. Este proceso es llevado a cabo manualmente: el usuario detecta una conformación incorrecta visualmente y, seguidamente, selecciona el par de puntos extremos correctos para obtener la mejor conformación calculada a partir de un camino que conecta dichos puntos, tal como se explica en la Sec. 2.2.9. Una operación (de la forma en que se utiliza en las tablas de esta sección) se considera como la acción de seleccionar dos puntos extremos y generar una nueva conformación. Seguidamente, se presenta la sección optimización de energı́a, en la que se presenta y se discute la distribución de los valores de energı́a para las diferentes conformaciones, por cada imagen de prueba. Detección y Ajuste Automático (Imagen de Prueba 1) Dado que todos los puntos extremos de la imagen 1 son encontrados automáticamente, como se muestra en la Tabla 3.3, sólo se presentan los resultados para las variantes multicamino y predicción, que incluyen todos los puntos extremos. La efectividad de detección y el tiempo de corrida para estas variantes son presentadas en la Tabla 3.4. Se puede observar que para ambas variantes los gusanos aislados fueron detectados en su totalidad. Para la variante multicamino se ajustaron correctamente tres cuartos de los gusanos en agrupaciones. Por otro lado, la variante predicción permitió ajustar correctamente todos los gusanos de la imagen, de forma automática. El tiempo de ejecución es ligeramente mayor para la variante de predicción, como era de esperarse debido a los cálculos adicionales 49 Tabla 3.4: Resultados del ajuste automático de gusanos en la imagen 1 Variante Gusanos aislados ajustados Multicamino Predicción 11/11 (100 %) 11/11 (100 %) Gusanos ajustados en agrupaciones 6/8 (75 %) 8/8 (100 %) Ajuste Total 17/19 (89.5 %) 19/19 (100 %) Tiempo (s) 6.47 7.53 requeridos por el algoritmo de predicción de caminos. Para la imagen 1, la variante predicción presentó una mejora considerable a la solución, al inducir la selección de caminos más probables. Por otro lado, los gusanos aislados fueron detectados en su totalidad, independientemente de la variante seguida. La asignación de conformaciones de la variante predicción, para la imagen 1, es mostrada en la Fig. 3.2. (a) Ajuste automático (b) Ajuste automático superpuesto con imagen original Figura 3.2: Mejor ajuste automático en la imagen 1 Detección y Ajuste Automático (Imagen de Prueba 2) En la tabla 3.5 se muestran los resultados del proceso de detección y ajuste automático de formas, para la imagen 2. Se puede observar que la totalidad de gusanos aislados fue detectada en cada variante. Para las dos variantes con puntos extremos faltantes, sólo se pudo ajustar correctamente alrededor de la mitad de los gusanos en la imagen. Aquı́ se evidencia el hecho de que la falta de un punto de extremo determinado hace imposible detectar el gusano al que corresponde. 50 Tabla 3.5: Resultados del ajuste automático de gusanos en la imagen 2, agregando y sin agregar puntos extremos faltantes (pf) Variante Gusanos aisla- Gusanos ajus- Ajuste Total Tiempo (s) dos ajustados tados en agrupaciones Multicamino - pf 8/8 (100 %) 7/25 (28 %) 15/33 (45.4 %) 21.8 Predicción - pf 8/8 (100 %) 10/25 (40 %) 18/33 (54.5 %) 23.7 Multicamino + pf 8/8 (100 %) 15/23 (65.2 %) 23/33 (69.7 %) 42.3 Predicción + pf 8/8 (100 %) 21/25 (84 %) 29/33 (87.8 %) 45 Para las variantes que incluyen los puntos extremos, los resultados son considerablemente superiores. Se puede observar que en las variantes de predicción mejora la precisión de detección, tanto cuando se incluyen los puntos extremos faltantes como cuando no se incluyen. Ası́ mismo, el tiempo de ejecución aumenta cuando los puntos extremos son agregados, como es de esperarse. Para la variante de predicción el porcentaje de ajuste es considerablemente más alto que para la variante de multicamino. En el mejor de los casos, el proceso automático permite ajustar la forma de todos los gusanos aislados y un alto porcentaje de los gusanos que pertenecen a agrupaciones (87,8 %), en menos de un minuto. Correcion Manual (Imagen de Prueba 2) La variante de predicción sin puntos faltantes dio los mejores resultados con sólo cuatro gusanos aislados ajustados incorrectamente, sobre un total de treinta y tres. A través del proceso manual se pudo corregir todas las conformaciones asignadas incorrectamente. De esta manera se pudo detectar y ajustar la forma de todos los gusanos de la imagen. En la figura A.1, presente en el Apéndice A se muestra una comparación de las conformaciones encontradas de manera automática y las conformaciones corregidas de forma manual. Detección y Ajuste Automático (Imagen de Prueba 3) Los resultados del proceso de detección y ajuste automático de formas en la imagen 3 son presentados en la Tabla 3.6. Los gusanos aislados fueron detectados en su totalidad. Para las variantes de predicción y multicamino con puntos extremos faltantes, el porcentaje de detección se ubica alrededor de 51 Tabla 3.6: Resultados del ajuste automático de gusanos en la imagen 3, agregando y sin agregar puntos extremos faltantes (pf) Variante Gusanos aisla- Gusanos ajus- Ajuste Total Tiempo (s) dos ajustados tados en agrupaciones Multicamino - pf 13/13 (100 %) 5/25 (20 %) 18/38 (47.3 %) 26.4 Predicción - pf 13/13 (100 %) 7/25 (28 %) 20/38 (52.6 %) 28.7 Multicamino + pf 13/13 (100 %) 13/25 (52 %) 26/38 (68.4 %) 36.2 Predicción + pf 13/13 (100 %) 16/25 (64 %) 29/38 (76.3 %) 39.8 la mitad de los gusanos la imagen. Por el contrario, en las variantes que incluyen los puntos extremos faltantes, el nivel de precisión aumenta considerablemente. La variante de predicción es siempre mejor que multicamino, aunque un poco más lenta. La mejor variante resultó ser predicción sin puntos faltantes, alcanzando a ajustar correctamente todos los gusanos aislados y un total de tres cuartos de la imagen total. Corrección Manual (Imagen de Prueba 3) La variante de predicción que incluye los puntos faltantes resultó ser la mejor, donde sólo nueve gusanos fueron detectados incorrectamente sobre un total de treinta y ocho. Se requirieron nueve operaciones simples para corregir los gusanos ajustados incorrectamente. Todos los gusanos en la imagen pudieron ser detectados y ajustados. En la figura A.2, presente en el Apéndice A se muestra una comparación de las conformaciones encontradas de manera automática y las conformaciones corregidas de forma manual. 3.2.3. Optimización de Energı́a El valor de energı́a de una conformación determina su grado de precisión con respecto a la figura. Tal como se describe en la Sec. 2.2.8, la función de energı́a evalúa la distancia entre formas como el porcentaje de pı́xeles de fondo que están contenidos en la silueta que se ajusta, por lo que todos los posibles valores de energı́a están contenidos en el intervalo [0, 1]. En la Figura 3.3 se muestran los valores de energı́a para las mejores tres conformaciones por cada punto extremo de gusano, para cada imagen del conjunto de prueba. La primera corresponde a la conformación correcta y ajusta el gusano de la imagen. Las siguientes dos corresponden a las mejores conformaciones entre puntos extremos incorrectos. Estas últimas dos serán denominadas primera conformación incorrecta y segunda conformación incorrecta, 52 respectivamente. Imagen de Prueba 1 Para la mayorı́a de los puntos extremos la conformación correcta tiene el menor valor de energı́a. En solo dos casos, existe una conformación incorrecta que tiene un valor de energı́a menor. La segunda conformación incorrecta posee siempre un valor de energı́a mayor que la conformación correcta. Imagen de Prueba 2 Se puede observar que la segunda conformación incorrecta (en verde) es, en todos los casos, bastante peor que la conformación correcta. Por esto, la conformación correcta corresponde siempre a la mejor o a la segunda mejor conformación encontrada, en términos de energı́a, de todas las posibles. Para esta imagen, solo en cuatro de veintinueve puntos extremos se sitúa a la primera conformación incorrecta (en rojo) con un mejor valor de energı́a que la correcta (en azul). Esto coincide con los resultados mostrados en la Tabla 3.6, donde, para la mejor variante automática, la cantidad de gusanos ajustados correctamente fue de veintinueve, sobre un total de treinta y tres, indicando error en cuatro puntos extremos (la misma cantidad de puntos en los cuales la conformación correcta no tuvo el mejor valor de energı́a). Ası́ mismo, la diferencia de energı́a entre la conformación correcta y la primera incorrecta, para estos cuatro puntos, es lo suficientemente pequeña para pensar que una función objetivo más sensitiva podrı́a permitir calcular la conformación correcta en todos los casos, de manera automática. Imagen de Prueba 3 Sólo para nueve de los veintidós puntos extremos, la primera conformación incorrecta resultó tener un mejor valor que la conformación correcta. Esto coincide con los resultados presentados en la Tabla 3.6, donde, para la mejor variante, la cantidad de gusanos detectados incorrectamente fue también de nueve, análogamente al caso anterior. Para cada punto extremo, con la excepción de uno, la segunda conformación incorrecta presenta un valor de energı́a menor a la conformación correcta. Por lo que la conformación correcta se encuentra siempre entre las mejores dos. .Dado que la cantidad de gusanos que pertenecen a agrupaciones de gusanos es alta (25), la probabilidad de conformaciones incorrectas aumenta. Las diferencias entre la conformaciones correctas y las seleccionadas para estos casos son estrechas (al igual que para la imagen 2 ), por lo que una función objetivo más sofisticada podrı́a conducir a mejores resultados. 53 0.020 Valor Funcional de Energ'ia correcta primera_incorrecta segunda_incorrecta 0.015 0.010 0.005 0.000 1 2 3 4 5 6 7 8 9 Puntos Extremos (a) Imagen 1 correcta primera_incorrecta segunda_incorrecta Valor Funcional de Energia 0.04 0.03 0.02 0.01 0.00 1 2 3 4 5 6 7 8 9 10 12 14 16 18 20 22 24 26 28 Punto Extremo (b) Imagen 2 0.020 Valor Funcional de Energia correcta primera_incorrecta segunda_incorrecta 0.015 0.010 0.005 0.000 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 Punto Extremo (c) Imagen 3 Figura 3.3: Valor de energı́a de las mejores tres conformaciones por punto extremo en el conjunto de prueba. Los puntos extremos corresponden a gusanos en agrupaciones con más de dos conformaciones posibles 54 Conclusiones y Trabajos Futuros En este capı́tulo se presentan las conclusiones sobre el enfoque metodológico provisto y sobre los resultados de la solución implementada. Seguidamente, se presentan algunas sugerencias de trabajo futuro, indicando las modificaciones que pueden llevarse a cabo para mejorar la solución. Conclusiones La metodologı́a propuesta provee un enfoque semi-automático para detectar y ajustar la forma de gusanos individuales en imágenes de microscopio. Esto permite convertir las imágenes de los gusanos en información manipulable y medible por computadora. La metodologı́a es lo suficientemente general para ajustarse a diferentes tipos de imágenes y especies de gusanos, ası́ como diferentes enfoques de implementación por etapa. El algoritmo desarrollado, que se deriva de la implementación provista, es lo suficientemente eficaz como para proveer la detección de la totalidad de los gusanos en corto tiempo utilizando una computadora personal, mejorando ası́ mismo el tiempo requerido y la precisión de la detección manual. Este estudio constituye uno de los primeros trabajos que trata la detección de gusanos en imágenes individuales (solo se conoce otro estudio, descrito en [16], que fue desarrollado al mismo tiempo) y el primero que permite que detectar la totalidad de los gusanos en las imágenes. Se dice que la solución es semi-automática por la necesidad de realizar ajustes manuales en dos etapas del proceso: detección de puntos extremos y ajuste final de formas. Una vez que los puntos extremos son completamente identificados, la parte automática de la solución provee un alto porcentaje de acierto (más de tres cuartas partes del total de los gusanos, en el peor caso), que puede incluso ser de 100 % en imágenes fáciles, que son aquellas con baja densidad de gusanos y baja cantidad de solapamientos (como se explica en la sección 3.1). El proceso de ajuste manual de conformaciones permite al usuario corregir las fallas de detección de la solución automática, proveyendo ası́ un ajuste óptimo o total. La solución implementada fue integrada con éxito a Endrov como extensión, y está siendo utilizada en este momento en los laboratorios del Departamento de Biociencias y Nutrición del Instituto Karolinska, en Flemingsberg, Suecia. La solución implementada provee la detección completa de todos los gusanos aislados, a través de un proceso automático y sin requerir adición manual de puntos extremos o correc- 55 ción de ajuste. A partir de los gusanos aislados se puede calcular exitosamente un perfil de los gusanos en la imagen. La detección y ajuste de formas de gusanos en agrupaciones representó el proceso más desafiante de la metodologı́a. Una alta densidad de gusanos lleva a múltiples solapamientos y a la creación de agrupaciones, donde algunos de los puntos extremos pueden no ser detectados. Algunos gusanos no se pueden detectar correctamente si hay puntos extremos faltantes, por lo que requieren ajustes manuales. La forma de gusanos aislados puede ser descrita con precisión en todos los casos. Las formas ajustadas en agrupaciones de gusanos representan en todos los casos de una forma muy precisa a los gusanos reales en la imagen. La heurı́stica de predicción de caminos permite mejorar considerablemente la efectividad de detección y ajuste del proceso automático. Debido a que las agrupaciones de gusanos proveen una gran cantidad de caminos posibles entre pares de puntos extremos, la predicción de caminos se convierte en una herramienta útil para determinar los caminos más probables que parten de cada punto extremo. Sin embargo, dada la naturaleza altamente deformable de las formas de gusanos, la heurı́stica falla en ocasiones en determinar el camino correcto para algunos puntos extremos. El proceso de optimización permite reducir considerablemente la diferencia entre la silueta genérica construida en base al descriptor de forma y la imagen, a través de la deformación. El enfoque de búsqueda local para el método de optimización resultó ser efectivo y rápido en la obtención de ajustes precisos. La eficacia de la búsqueda local reside en el hecho de que la silueta original es construida sobre un camino del esqueleto, y dado que éste tiende al eje medio de los objetos en la imagen, la silueta tiende a estar situada cerca de un gusano real en la imagen. La función objetivo, formulada en términos de energı́a, es lo suficientemente expresiva para posicionar la conformación correcta entre las dos mejores conformaciones posibles por punto extremo, para el conjunto de prueba utilizado en este trabajo. Las conformaciones correctas que parten de los puntos extremos detectados en las imágenes de prueba, resultan tener, en la mayorı́a de los casos, el menor valor de energı́a entre todas las conformaciones posibles por punto extremo, conduciendo por lo tanto a un ajuste correcto. Sin embargo, las dos mejores conformaciones tienden a estar muy cerca la una de la otra, en términos de energı́a, lo que lleva a errores de ajuste. Esto hace que la función objetivo no sea lo suficientemente expresiva como para proveer un ajuste automático perfecto en imágenes difı́ciles, que son aquellas con 56 alta densidad de gusanos y presencia de multiples solapamientos. Trabajos Futuros A continuación, se presentan una serie de sugerencias de trabajos futuros para mejorar la solución provista en este estudio. Función de Energı́a Una función de energı́a más sofisticada podrı́a permitir obtener diferencias más grandes entre las conformaciones optimizadas, conduciendo a un porcentaje de detección más alto. Una posible formulación podrı́a consistir en utilizar el mapa de distancias para evaluar la cercanı́a de la silueta que se deforma a contornos en la imagen, y empujarla hacia ellos. Los pı́xeles de fondo (de valor 0 en el mapa de distancia) tendrı́an que ser penalizados de cierta forma, y deberá buscar un equilibrio de distancias en la suma total del área de la silueta. Detección de Puntos Extremos Dado que la detección de puntos extremos juega un papel fundamental en el proceso de detección, una técnica más elaborada para la identificación de puntos extremos permitirı́a mejorar la eficiencia de la solución automática, reduciendo o eliminando la necesidad de agregar puntos manualmente. Una forma de encontrar puntos extremos faltantes podrı́a consistir en sacar provecho de la búsqueda informada que efectúa el algoritmo de predicción de caminos. La idea consistirı́a en trazar caminos a partir de los puntos extremos, hasta alcanzar un longitud de camino fija, e.g. la longitud estimada de los gusanos en la imagen. Una vez que se alcanzara este punto, si no se han encontrado puntos extremos, se agregarı́a uno en esta posición. Este enfoque tiene el problema de que se pueden agregar puntos extremos incorrectos. En vista de esto, se podrı́a ejecutar inicialmente el algoritmo de ajuste de formas para tener un visión previa del área que ha sido cubierta, y seguidamente, llevar a cabo un búsqueda de puntos extremos posibles en las áreas de la imagen que no fueron cubiertas. Otra solución es la de considerar las intersecciones entre los caminos del esqueleto como posibles puntos extremos, y realizar un análisis más profundo sobre la factibilidad de estos puntos y de las conformaciones obtenibles a partir de estos. 57 Seguimiento de Movimiento de Gusanos Una vez que los gusanos en la imagen son detectados por completo, se tiene información acerca de su posición y tamaño, y ası́ mismo es posible calcular información adicional tal como la rotación del gusano y la posición de la cabeza y la cola. Este tipo de información podrı́a ser muy valiosa para los algoritmos de seguimiento de movimiento de gusanos en imágenes, y otros enfoques basados en análisis simultáneo de grandes conjuntos de datos (tales como aquellos que son cubiertos en [4]), para detectar gusanos en agrupaciones. Desarrollo Actual Actualmente, el autor de este trabajo y el estudiante de Doctorado Johan Henriksson, están trabajando en la automatización de la solución provista, ası́ como en el refinamiento de la implementación. Recientemente se consiguió reducir el tiempo de detección automática en más del triple, al refinar el algoritmo de predicción de caminos y reducir la cantidad de conformaciones generadas. Por otro lado, se está utilizando la implementación integrada a Endrov del rasterizador de polı́gonos y descriptor general de formas para desarrollar un algoritmo de rastreo de peces en video. Bibliografı́a [1] Carlo Arcelli and Gabriella Sanniti di Baja. Ridge points in euclidean distance maps. Pattern Recognition Letters, 13:237–243, 1992. [2] Carlo Arcelli and Gabriella Sanniti di Baja. Euclidean skeleton via centre-of-maximaldisc extraction. Image and Vision Computing, 11:163–173, 1993. [3] Gunilla Borgefors. Distance transformation in digital images. Computer Vision, Graphics and Image Processing, 34:344–371, 1986. [4] Steven D. Buckingham and David B. Sattelle. Strategies for automated analysis of C. elegans locomotion. Invert Neurosci, 8:121–131, 2008. [5] Roland T. Chin and Hong-Khoon Wan. A one-pass thinning algorithm and its parallel implementation. Computer Vision, Graphics and Image Processing, 40:30–40, 1987. [6] Pedro F. Felzenszwalb and Daniel P. Huttenlocher. Distance transforms of sampled functions. Cornell Computing and Information Science Technical Report, 2004. [7] Johan Henriksson. Endrov. http://www.endrov.net/index.php?title=About, 2010. [8] Schafer WR Huang K-M, Cosman P. Automated detection and analysis of foraging behavior in caenorhabditis elegans. J Neurosci Methods, 2008. [9] Rolf Lakamper Longin Jan Latecki and Ulrich Eckhardt. Shape descriptors for non-rigid shapes with a single closed contour. Computer Vision, 1:424–429, 2000. [10] Xiang Bai Longin Jan Latecki, Quan-nan Li. Skeletonization using ssm of the distance transform. Technical report, Temple University, Philadelphia, USA, HuaZhong University of Science, and Technology, Wuhan, China, 2007. [11] Andrew Witkin Michael Kass and Demetri Terzopoulos. Snakes: Active contour models. International Journal of Computer Vision, pages 321–333, 1988. 59 [12] Akram Aldroubi Michael Unser and Murray Eden. B-spline signal processing: Part itheory. IEEE Transactions on Signal Processing, 41:821–832, 1993. [13] Hans Theornquist Mihail Ivanchev and Anubis. Software rendering school, part iii: Triangle rasterization. http://www.devmaster.net/articles/software-rendering/ part3.php, 2004. [14] Bryan S. Morse. Shape description (regions). http://homepages.inf.ed.ac.uk/rbf/ CVonline/ LOCAL COPIES/MORSE/region-props-and-moments.pdf. [15] P.E.Trahanias. Binary shape recognition using the morphological skeleton transform. Pattern Recognition, 25:1277–1288, 1992. [16] Tammy Riklin Raviv, V.Ljosa, A.L. Conery, F.M.Ausubel, A.E. Carpenter, P. Golland, and C. Waehlby. Morphology-guided graph search for untangling objects: C.elegans analysis. Springer-Verlag Berlin Heidelberg 2010, 2010. [17] Matthew Baker Sasakthi Abeysinghe, Tao Ju and Wah Chiu. Shape modeling and matching identifying 3d protein structures. Computer-Aided Design, 40:708–720, 2008. [18] Mehmet Sezgin and Bulent Sankur. Survey over image thresholding techniques and quantitative performance evaluation. Journal of Electronic Imaging, 13:146–165, 2004. [19] Linda G. Shapiro and George C. Stockman. Computer Vision. Prentice Hall, 2002. [20] Frank Y. Shih and Christopher C.PU. A skeletonization algorithm by maxima tracking on euclidean distance transform. Pattern Recognition, 28:331, 1994. [21] Frank Y. Shih and Christopher C. Pu. A skeletonization algorithm by maxima tracking on euclidean distance transform. Pattern Recognition, 28:331–341, 1995. [22] Alexandru Telea and Jarke J. van Wijk. Shape descriptors for non-rigid shapes with a single closed contour. In EUROGRAPHICS - IEEE TCVG Symposium on Visualization, 2002. [23] C.J.Taylor T.F.Cootes, D.H.Cooper and J.Graham. A trainable method of parametric shape description. Computer Vision, 5:237–252, 2009. [24] Marcel Luthi Thomas Albrecht and Thomas Vetter. Deformable models. http://gravis.cs.unibas.ch/publications/CH Deformable Models09.pdf. [25] Remco C. Veltkamp. Shape matching: Similarity measures and algorithms. Dept. Computing Science, Utrecht University. 60 [26] Remco C. Veltkamp and Michiel Hagedoorn. State-of-the-art in shape matching. Principles of visual information retrieval.-(Advances in pattern recognition), 2:87–112, 2001. [27] Carolina Waehlby, Tammy Riklin-Raviv, Annie L. Conery Vebjorn Ljosa, Polinga Golland, Frederick M.Ausubel, and Anne E. Carpenter. Resolving clustered worms via probabilistic shape models. ISBI: International Symposium on Biomedical Imaging 2010, 2010. [28] Wikipedia. Topological skeleton. http://en.wikipedia.org/wiki/ Topological skeleton. [29] Wikipedia. Endrov. http://en.wikipedia.org/wiki/Endrov, 2010. [30] Wikipedia. High throughput screening. High-throughput_screening, October 2010. [31] Wikipedia. Spline (mathematics). (mathematics), 2010. http://en.wikipedia.org/wiki/ http://en.wikipedia.org/wiki/Spline_ [32] Wikipedia. Thresholding (image processing). Thresholding_(image_processing), June 2010. http://en.wikipedia.org/wiki/ [33] Frank Y.Shih and Yi-Ta Wu. Fast euclidean distance transformation in two scans using a 3 x 3 neihborhood. Computer Vision and Image Understanding, 93:195–205, 2002. [34] T.Y. Zhang and C.Y. Suen. A fast parallel algorithm for thinning digital patterns. Image Processing and Computer Vision, 27:235–239, 1984. Apéndice A Imágenes adicionales obtenidas a través de la solución implementada Esta sección del apéndice presenta un conjunto de imágenes que fueron obtenidas en algunos de los procesos intermedios de la metodologı́a de la solución, al aplicar el algoritmo implementado a imagenes de prueba. A.1. Ajuste de Formas y Corrección Manual Las figura A.1 y A.2 muestran el resultado del proceso de ajuste de formas sobre imágenes de gusanos en cultivo lı́quido. En particular, estas imágenes corresponde, respectivamente, a las imágenes de prueba 2 y 3 utilizadas en los experimentos de el presente trabajo (ver Capı́tulo 3). En cada caso se presenta la imagen original, seguida de la imagen obtenida a través del proceso ajuste de formas automático, donde se indica en color las formas detectadas incorrectamente. Se presenta también la imagen obtenida despues de realizar la corrección manual, donde ahora las formas en color representan las conformaciones corregidas, y por último se muestra una imagen que superpone el ajuste despues de correcciones manuales con la imagen original. A.2. Transformada de Distancia La Figura A.3 muestra una imagen binaria de un gusano en medio lı́quido y tres mapas de distancia obtenidos a partir de dicha imagen binaria. 62 A.3. Esqueleto Topológico de Gusanos La Figura A.4 presenta el esqueleto topológico obtenido para un imagen que de gusanos en cultivo lı́quido a través de la implementación del proceso de skeletonization descrito en la Sección 2.2.4 de este trabajo. A.4. Método del Valor Umbral La Figura A.5 presenta las mejores imágenes binarias que pudieron obtenerse a través de los métodos del valor umbral Fukunaga, máxima entropı́a, Otsu y percentil, a partir de una imagen de gusanos en medio lı́quido (correspondiente a la imagen de prueba 2, como fué definida en el Capı́tulo 3). 63 (a) Imagen de prueba 2. Original (b) Ajuste automático (c) Ajuste automático y manual (d) Ajuste automático y manual superpuesto con imagen original Figura A.1: Mejor ajuste automático y corrección manual para la imagen A.1a. Las formas y contornos en color en imágenes A.1b y A.1c indican gusanos detectados incorrectamente 64 (a) Imagen de prueba 3. Original (c) Ajuste automático y manual (b) Ajuste automático (d) Ajuste automático y manual superpuesto con imagen original Figura A.2: Mejor ajuste automático y corrección manual para la imagen A.2a. Las formas y contornos en color en imágenes A.2b y A.2c indican gusanos detectados incorrectamente 65 (a) Imagen Binaria (b) Distancia de Manhattan (c) Distancia de tablero de ajedrez (d) Distancia Euclidiana Figura A.3: Imagen binaria y tres mapas de distancia utilizando diferentes métricas, a partir de la imagen de un gusano 66 Figura A.4: Esqueleto topológico de una imagen de gusanos en cultivo lı́quido 67 (a) Imagen original (b) Imagen binaria superpuesta con original. Método máxima entropı́a (c) Imagen binaria superpuesta con original. Método otsu (d) Imagen binaria superpuesta con original. Método fukunaga con 3 clases (e) Imagen binaria superpuesta con original. Método percentil con un valor de 0.1 Figura A.5: Diferentes métodos del valor umbra aplicados a una imagen de gusanos en medio lı́quido