sistema para el análisis avanzado de imágenes médicas de

Anuncio
SISTEMA PARA EL ANÁLISIS AVANZADO DE IMÁGENES
MÉDICAS DE TOMOGRAFÍA AXIAL COMPUTARIZADA (TAC)
ADVANCED ANALYSIS SYSTEM FOR MEDICAL IMAGING COMPUTED TOMOGRAPHY
Felipe Rodríguez Arias1, Noel Rodríguez Arias2, Joan Alberto Aguilar Peña3
1 Centro de Estudios de Neurociencias, Procesamiento de Imágenes y Señales (CENPIS). Facultad de Ingeniería Eléctrica.
Universidad de Oriente, Cuba, farias@uo.edu.cu, Ave. Las Américas s/n e/ L e I. Santiago de Cuba.
2 Centro de Informática Médica. Universidad de las Ciencias Informáticas (UCI), Cuba, nrarias@uci.cu
3 CENPIS, Cuba, jaguilar@uo.edu.cu
RESUMEN: El siguiente trabajo describe la propuesta de un software que incorpora algoritmos de visión por
computadora y técnicas de reconocimiento de patrones para facilitar la comparación y análisis de imágenes
médicas obtenidas principalmente mediante tomografía axial computarizada multi-corte o a través de otras técnicas de adquisición de imágenes médicas digitales. El estudio de las imágenes se realiza mediante un visor
que posibilita un conjunto de opciones de configuración para el mejoramiento y transformación de la imagen, el
marcaje de áreas de interés y su comparación basada en las características del contenido de la imagen objetivo
con una base de datos de imágenes de muestra. Estos conceptos permiten ir más allá de donde puede llegar el
ojo y la percepción humana lo que ayudará de manera significativa a los especialistas en la toma de decisiones.
Palabras Clave: reconocimiento de patrones, wavelets, imágenes médicas, visión artificial, tac.
ABSTRACT: The following paper describes a software containing algorithms of computer vision and pattern
recognition techniques to facilitate comparison and analysis of medical images obtained by computed tomography mainly multi-cut or through other techniques of medical imaging digital. The study of images is done using a
viewer that allows a set of configuration options for the improvement and transformation of the image, marking
areas of interest and comparison based on the characteristics of the content of the target image with a database
of image samples. These concepts allow to go beyond where the eye can reach and human perception which
will help significantly to specialists in making decisions.
KeyWords: pattern recognition, wavelets, medical imaging, computer vision, tac.
1. INTRODUCCIÓN
En la actualidad el sector de la salud demanda una
mejor prestación de servicios con diagnósticos confiables y respuestas ágiles y oportunas al paciente;
para ello se utilizan con frecuencia diversos tipos de
ayudas diagnósticas, entre las cuales las imágenes
digitales son cada vez más comunes. A propósito
de esto, los avances tecnológicos en las telecomunicaciones y los nuevos desarrollos en informática
resultan una ayuda importante en el manejo y administración de la información médica [1].
“XI Congreso Internacional de Informática en Salud 2016”
Rodríguez, F.; Rodríguez, N.; Aguilar, J.A. | “SISTEMA PARA EL ANÁLISIS AVANZADO DE IMÁGENES MÉDICAS DE TOMOGRAFÍA AXIAL COMPUTARIZADA (TAC)”
El diagnóstico por imágenes constituye uno de los
elementos importantes en la práctica de la medicina
moderna. Un alto porcentaje de la información médica se representa en imágenes digitales y análogas producidas en diversas modalidades como
tomografía computadorizada (TC), resonancia
magnética (RM), radiografía computadorizada (RC),
exámenes de medicina nuclear (SPECT, PET) y
ultrasonido (US), entre otras [2]. Estas imágenes
con frecuencia se almacenan en formatos estándares como ACR-NEMA, PAPYRUS, INTERFILE
v3.3, QSH, DEFF, DICOM y otros formatos propietarios como SPI, Analize y Genesis, o alguna combinación de ellos.
En este ambiente, existen también los sistemas de
visualización de imágenes médicas, que utilizan
estos diferentes formatos mediante una infraestructura de sistema de archivado y transmisión de imágenes denominada PACS, por sus siglas en inglés
[1]. Estos sistemas de visualización son de gran
importancia por ser la herramienta con la que interactúan directamente los especialistas, a fin de representar las imágenes médicas para su análisis y
diagnóstico.
Desde finales del siglo XX hasta hace poco el software desarrollado en nuestro país en este sentido
se centra en la creación y perfeccionamiento de los
sistemas de almacenamiento y transmisión de imágenes (PACS) [3], [4], [5]. La implantación de este
mecanismo de comunicación representa el paso
inicial para la creación de la infraestructura necesaria que los procedimientos de visualización de imágenes médicas utilizan en función de los diferentes
tipos de formatos existentes, por ejemplo DICOM.
En nuestro país y el resto del mundo existen varias
herramientas informáticas para el análisis y comparación de imágenes médicas. La tendencia de estos
productos, en sentido general, es de ofrecer cada
vez más una mayor gama de opciones de configuración y visualización que le faciliten al médico un
diagnóstico certero. Muchas de las opciones básicas permiten el mejoramiento de las imágenes,
observarlas desde varios puntos de vista, realizar
marcajes de áreas de interés, cálculo de volumen,
entre otras. Todo esto determina una especialización de los médicos en la utilización de una u otra
herramienta, lo cual se logra en un considerable
espacio de tiempo.
Con el propósito de disminuir el esfuerzo y la curva
de aprendizaje en el manejo de los sistemas de
visualización resulta necesaria la introducción de
opciones mucho más avanzadas utilizando algoritmos de reconocimiento de patrones basados en
técnicas de visión artificial; para proveer la prescripción automática o asistida de alguna patología
aunque la decisión final referente a un diagnóstico
siempre será responsabilidad de un experto.
2. MATERIALES Y MÉTODOS
En la última década en el sistema de hospitales de
Cuba se han adquirido e instalado equipos de última generación DICOM compatibles. En las instituciones hospitalarias del país son empleados varios
sistemas para el análisis de las imágenes médicas
digitales, entre los que se destacan el Syngo FastView [6], el iMagis [7] y el Sistema el Almacenamiento, Transmisión y Visualización de Imágenes
Médicas del Centro de Informática Médica de la
Universidad de Ciencias Informáticas (UCI), específicamente el componente PACSViewer [8]. La primera de las soluciones es de origen alemán, producto de la compañía Siemens AG, especializada
en el sector de la salud, entre las primeras del
mundo. Los otros dos productos han sido creados
por especialistas cubanos y se exportan a varios
países de Latinoamérica y el Caribe.
Estos sistemas presentan un conjunto de funcionalidades orientadas a mejorar la visualización y análisis de las imágenes, por lo que resultan herramientas muy útiles y profesionales. No obstante,
por lo general las opciones disponibles no van más
allá del estudio de la imagen digital objetivo y en
raras ocasiones se permite la comparación de imágenes de estudios anteriores para comprobar ambientes similares y posibilitar un mejor diagnóstico
mucho más rápido y preciso.
El sistema propuesto en esta investigación no pretende competir con sus similares cubanos, sino
complementar y favorecer algunas de sus funcionalidades con la utilización de técnicas de visión
computacional y reconocimiento de patrones con el
propósito de realizar un mejor estudio y clasificación del paciente, aumentando el valor añadido de
los productos informáticos.
2.1 Recuperación de imágenes basada en
contenido
Los métodos de Recuperación de Imágenes Basado en Contenido (Content Based Image Retrieval,
CBIR), caracterizan a una serie de algoritmos que
permiten describir una imagen según su propio
contenido visual [9]. Una técnica CBIR utiliza el
procesamiento digital de imágenes y técnicas habituales de consultas [10], permitiendo que una imagen de entrada requerida por un usuario sea transformada en una descripción simbólica derivada de
ella; respondiendo con el hallazgo de otra(as) imagen(es) con el mismo o parecido contenido [11].
Los elementos fundamentales que conforman a
todo sistema de búsqueda de imágenes por conte-
“XI Congreso Internacional de Informática en Salud 2016”
Rodríguez, F.; Rodríguez, N.; Aguilar, J.A. | “SISTEMA PARA EL ANÁLISIS AVANZADO DE IMÁGENES MÉDICAS DE TOMOGRAFÍA AXIAL COMPUTARIZADA (TAC)”
nido son, extracción de características visuales de
las imágenes, la función de similitud y el indexado
multidimensional. La extracción de características
tiene como función resumir en un conjunto de índices o coeficientes, nombrados firma de la imagen,
la información más importante de la misma. Este
aspecto es de alta incidencia tanto en la rapidez del
sistema, al reducir el volumen a comparar, como en
el rendimiento, ya que la información que sea eliminada en este paso no tendrá aporte en la comparación de similitud. La función de similitud debe evaluar las firmas de la imagen de búsqueda y una
imagen en la base de datos del sistema y devolver
un índice que expresa el parecido entre dichas
imágenes. El indexado multidimensional permite
agrupar la información, logrando una reducción
considerable en los tiempos de búsqueda [12].
La recuperación de imágenes basada en contenido
ha sido interpretada por muchos como la solución
de varios problemas, entre ellos en el ámbito de la
arquitectura e ingeniería de diseño, imágenes astronómicas, sistema de información geográfica,
imágenes médicas, investigación criminal y técnicas
forenses, entre otras áreas. Asimismo el reconocimiento de rostros es interpretado como un problema que puede ser solucionado efectivamente a
través de aplicaciones CBIR [13].
2.2 Tecnologías de desarrollo
Dentro de la amplia gama de opciones existentes
hoy en día a la hora de escoger una tecnología de
desarrollo de software, se optó por la plataforma
.Net, debido las amplias capacidades y características que brinda a los desarrolladores.
2.2.1
Plataforma .Net
.Net es una constelación de tecnologías orientadas
al desarrollo de software de propósito general, desde aplicaciones empresariales hasta sistemas de
entretenimiento y ocio. Posee una gran capacidad
de convergencia entre tecnologías de naturaleza
distinta garantizando en todo momento la compatibilidad entre ellas [14]. Plantea un entorno de desarrollo y ejecución manejado, lo cual le permite garantizar la seguridad e integridad del código que se
ejecuta y resulta un estándar mundial de referencia
para muchos desarrolladores hoy en día.
2.2.2
Windows Presentation Foundation
WPF ofrece una amplia infraestructura y potencia
gráfica con la que es posible desarrollar aplicaciones visualmente atractivas, con facilidades de interacción que incluyen animación, vídeo, audio, documentos, navegación o gráficos 3D. Separa, con
el lenguaje declarativo XAML y los lenguajes de
programación de .Net, la interfaz de interacción
visual de la lógica del negocio [15]. Se adapta de
manera sencilla al patrón arquitectónico MVVM.
2.2.3
Arquitectura MVVM
La idea principal del patrón arquitectónico ModelView-ViewModel (MVVM), es la separación de responsabilidades en la programación dentro de los
componentes de un sistema. El concepto fundamental de MVVM es separar el Modelo de la Vista
introduciendo una capa abstracta entre ellos (VistaModelo) que permite gestionar la interacción y los
estados de una forma más sencilla y escalable [8].
Figura. 1: Patrón Model-View-ViewModel
2.3 Librerías de visión artificial
En la implementación de los algoritmos y técnicas
de visión y reconocimiento de patrones, se ha hecho uso de varias librerías, las cuales ofrecen un
conjunto de implementaciones funcionales, a través
de interfaces bien definidas para la funcionalidad
que se invoca. Estas son de libre acceso y con una
amplia comunidad de desarrolladores a nivel mundial.
2.3.1
OpenCV
Es una biblioteca multiplataforma de visión artificial
originalmente desarrollada por Intel. Se distribuye
bajo licencia de software libre BSD y posee una API
de programación con más de 500 funciones que
facilitan el procesamiento de imágenes y video. Se
ha utilizado en infinidad de aplicaciones desde sistemas de seguridad con detección de movimiento,
hasta aplicaciones para el control de procesos donde se requiere reconocimiento de objetos.
OpenCV está escrita completamente en lenguaje
C/C++; por lo que se hizo necesario utilizar un envoltorio para su uso en la tecnología .Net; este es el
caso del EmguCV [16].
“XI Congreso Internacional de Informática en Salud 2016”
Rodríguez, F.; Rodríguez, N.; Aguilar, J.A. | “SISTEMA PARA EL ANÁLISIS AVANZADO DE IMÁGENES MÉDICAS DE TOMOGRAFÍA AXIAL COMPUTARIZADA (TAC)”
2.3.2
AForge.Net
: la media de los pixeles en la vecindad,
Librería de funciones de inteligencia artificial y visión computacional desarrollada por Andrew Kirillov
sobre la plataforma .Net. El código fuente del proyecto se encuentra disponible bajo los términos de
las licencias de código abierto Lesser GPL y GPL.
2.3.3
WPF Extended Toolkit
Esta librería constituye un complemento de la tecnología WPF, mediante la cual se incorporan nuevos componentes visuales, diseñados especialmente para el trabajo con imágenes en sistemas de
multimedia y presentación de interfaces de usuario.
2.4 Técnicas de pre-procesamiento de imágenes empleadas
Los métodos de mejoramiento y pre-procesamiento
de imágenes digitales se ejecutan con el propósito
de mejorar la calidad, corregir afectaciones o facilitar la búsqueda de información. Engloba un conjunto de técnicas cuyo objetivo principal es obtener, a
partir de una imagen de origen, otra final cuyo resultado sea, más adecuado para una aplicación
específica potenciando ciertas características para
luego efectuar otras operaciones.
2.4.1
Filtro de Mediana
Se utiliza en el sistema para la disminución del ruido en caso de ser necesario, sin introducir el efecto
de desenfoque propio de otros filtros destinados a
este mismo objetivo. Se considera un algoritmo
bastante efectivo frente a los ruidos de impulso,
muy comunes en las imágenes obtenidas por propiedades electromagnéticas.
2.4.2
Filtro Gaussiano
Mediante este filtro el valor de cada pixel es el resultado de promediar con distintos pesos los valores vecinos a ambos lados de dicho punto. Este tipo
de filtro reduce especialmente el ruido tipo gaussiano producido por pequeñas variaciones en la
imagen que tienen su origen en diferencias de
ganancias del sensor o el ruido en la digitalización,
entre otras. Representa un filtro pasa bajo que suaviza la imagen objetivo. Su forma matemática se
representa así [17]:
(1)
donde:
: constante caracterizada por
,
: la varianza en la vecindad.
2.4.3
Ecualización del histograma
El histograma de una imagen es una representación gráfica de la frecuencia con la que los niveles
de gris aparecen en ella. Es una herramienta fundamental para el análisis de imágenes digitales,
permite obtener una probabilidad de cada escala de
gris sacrificando la localización espacial. El visor
desarrollado permite la modificación del histograma
visualizado a través de funciones de transferencia,
que corresponden a curvas acotadas en abscisas y
ordenadas entre 0 y 1 [18].
La ecualización del histograma tiene por objetivo
obtener un nuevo histograma, a partir del original,
con una distribución uniforme de los diferentes niveles de intensidad. Se obtiene el mismo número de
pixeles en todas las escalas de grises, lo que mejora la apariencia visual de la imagen.
2.4.4
Operador Sobel
Es utilizado especialmente en la detección de bordes. Técnicamente es un operador diferencial discreto que calcula una aproximación al gradiente de
la función de intensidad de una imagen. Caracteriza
la ejecución de un filtro espacial pasa alto mediante
un operado de primera derivada. Para cada punto
de la imagen a procesar, el resultado de este operador es tanto el vector gradiente correspondiente
como la norma de éste vector. Emplea el siguiente
kernel:
(2)
De igual forma se utilizan algunas variantes que
presentan las mismas características del operador
Sobel pero determinados por otros kernel. Las variantes se denominan Prewit (3) y Kirsh (4) y sus
matrices representativas son:
(3)
2.4.5
(4)
Filtro de Canny
El algoritmo de detección de bordes de Canny utiliza un filtro basado en la primera derivada de una
gaussiana. Ya que es susceptible al ruido presente
en datos de imagen sin procesar, la imagen original
es transformada con un filtro gaussiano. Consta de
4 fases [17]:

Obtención del gradiente.
“XI Congreso Internacional de Informática en Salud 2016”
Rodríguez, F.; Rodríguez, N.; Aguilar, J.A. | “SISTEMA PARA EL ANÁLISIS AVANZADO DE IMÁGENES MÉDICAS DE TOMOGRAFÍA AXIAL COMPUTARIZADA (TAC)”

Supresión no máxima al resultado del gradiente.

Histéresis de umbral a la supresión no máxima.

Cierre de contornos abiertos.
2.5 Algoritmos de visión artificial y reconocimiento de patrones utilizados en el
sistema
La utilización de técnicas de visión artificial y reconocimiento de patrones en imágenes digitales, es
precisamente la principal característica de este
trabajo. A continuación se exponen los principales
algoritmos implementados y su funcionalidad dentro
del sistema.
cercano a la solución (por ejemplo un contorno
esbozado manualmente u obtenido mediante un
método clásico), el contorno evoluciona hasta el
mínimo local más cercano, es decir, al contorno
buscado [20].
Los snakes se pueden considerar un ejemplo de un
caso más general de ajuste de modelos deformables a la imagen mediante un proceso de minimización energética. Matemáticamente tiene la siguiente
forma:
(5)
donde:
: describe el contorno,
: energía del contorno (interior y exterior),
: estado del contorno.
2.5.1
Snake
Utilizado mayormente en la detección de formas
de tumoraciones o tejidos afectados; lo que permite
luego la segmentación de esta área para aislarla
del resto de la imagen y poder procesarla de manera independiente.
El problema que intenta resolver consiste en la
localización de bordes, líneas y contornos subjetivos, así como el seguimiento de dichos contornos
durante el movimiento. Es un método que varía su
expresión en función de la energía del ambiente
buscando contornos en la imagen, cuya filosofía se
puede considerar novedosa con respecto a los métodos clásicos de detección de bordes y enlazado
posterior. En este modelo tanto la conectividad de
los contornos, como la presencia de bordes en la
imagen van a afectar al funcional de energía y, por
lo tanto, a los detalles de la estructura del contorno
localmente óptimo. Además, pueden interactuar
mecanismos de alto nivel introducidos por el usuario con el modelo de contorno para llevarlo hacia el
mínimo local apropiado.
A diferencia de otras técnicas que buscan contornos prominentes de la imagen, este modelo de
contorno es activo. Siempre está minimizando su
funcional energético y por lo tanto va a tener un
comportamiento dinámico. Debido a cómo se desliza el contorno mientras que minimiza su energía,
se denomina snake [19]. Cambios en la interpretación a alto nivel se van a modelar como fuerzas
externas en el snake según continúa el proceso de
minimización.
Un snake no está pensado, en principio, para resolver el problema de búsqueda automática de contornos prominentes de la imagen, sino para refinar la
solución propuesta por otra serie de mecanismos.
Es decir, si se parte de un contorno relativamente
2.5.2
Transformada de Hough
Esta es una técnica que permite descubrir formas
en una imagen. Se basa en transformar puntos de
la imagen en un espacio de parámetros. La idea es
encontrar curvas parametrizables como rectas,
círculos y polinomiales. En teoría se pueden encontrar formas más complejas pero el costo computacional crece rápidamente. Generalmente se realiza detección de bordes a la imagen, y luego se
aplica la transformada a esta. De esta forma son
menos los puntos que hay que recorrer y por lo
tanto más rápido es el algoritmo [20].
Se emplea para la detección de círculos y líneas en
las imágenes, con el objetivo de segmentar y aislar
zonas de interés. La configuración para la detección
de círculos tiene tres parámetros (dos para el centro del círculo, uno para el radio).
2.5.3
Coeficiente de correlación de Pearson
Es un algoritmo utilizado para determinar el nivel de
correlación (similitud), entre dos matrices (imágenes). De manera formal, el coeficiente de correlación de Pearson se puede definir como un índice
que mide el grado de relación de dos variables
siempre y cuando ambas sean cuantitativas. El
cálculo del coeficiente queda establecido por:
(6)
donde:
: es la covarianza de
,
: la desviación típica de la variable ,
: la desviación típica de la variable .
“XI Congreso Internacional de Informática en Salud 2016”
Rodríguez, F.; Rodríguez, N.; Aguilar, J.A. | “SISTEMA PARA EL ANÁLISIS AVANZADO DE IMÁGENES MÉDICAS DE TOMOGRAFÍA AXIAL COMPUTARIZADA (TAC)”
El valor del coeficiente se mueve de 0 a 1; mientras
más cerca esté de 1 o -1(en sentido directo o inverso respectivamente), mayor correlación existirá.
Cuando se acerca a 0, indica que existe menor
correlación entre las matrices que representan las
imágenes.
2.5.4
en una imagen, prueba de ello es el elevado número de esquemas de compresión, con buenos rendimientos y alta calidad que se basan en TDW, incluido el estándar JPEG2000 [21]. Además, sus
buenas propiedades para representar eficientemente los bordes, han sido usadas para la obtención de
descriptores de textura y forma [22].
Transformada rápida de Fourier
Es un algoritmo muy eficiente que permite calcular
la transformada discreta de Fourier (DFT) y su inversa. La transformada rápida de Fourier (Fast Fourier Transform, FFT) es de gran importancia en una
amplia variedad de aplicaciones, desde el tratamiento digital de señales y filtrado digital en general, hasta la resolución de ecuaciones en derivadas
parciales o los algoritmos de multiplicación rápida
de grandes enteros.
Una serie de Fourier puede considerarse como la
suma de un conjunto de funciones sinusoidales de
diferentes frecuencias, promediada por unos coeficientes, con objetivo de aproximación a una función
.
La función periódica en el tiempo, de período
, puede expresarse como:
2.6.1
Análisis wavelet de señales bidimensionales
La TDW en imágenes es un procedimiento que se
aplica de forma separada a lo largo de cada dimensión (largo y ancho), de manera que, en esencia,
representa un esquema de descomposición para
señales unidimensionales, primero se aplica en un
eje y luego en el otro [23].
Como se muestra en el esquema de la Figura 2 una
transformada wavelet bidimensional es la combinación de dos transformadas de wavelet unidimensionales. Primero se aplica el análisis unidimensional a
todo lo largo de la imagen y luego a lo ancho, realizando el sub-muestreo característico en cada subbanda de salida.
(7)
Estos coeficientes evalúan qué peso tiene cada una
de las funciones sinusoidales a la hora de construir
la función
. De manera general el conjunto de
señales sinusoidales (senos y cosenos), constituye
una base de funciones en el dominio de la frecuencia. Al final la transformada de Fourier de una función
es una extensión de las series de Fourier
a señales no periódicas. Las fórmulas (8) y (9) corresponden a la transformada directa y a la inversa
respectivamente:
(8)
(9)
2.6 Sistema de reconocimiento basado en la
Transformada de Wavelet
Las wavelets son funciones que cumplen con ciertas propiedades matemáticas y se usan para representar datos y otras funciones. Permiten procesar
datos a diferentes escalas o resoluciones. A diferencia de la transformada de Fourier permite el
análisis haciendo uso de la localización espacial y
de frecuencia en el mismo instante.
El análisis de imágenes mediante la Transformada
Discreta de Wavelet (TDW) ha demostrado ser una
manera efectiva para sintetizar el contenido visual
Figura.2: Transformada wavelet de un nivel para
señales bidimensionales.
Para un nivel de descomposición de una señal 2D o
imagen (Figura 3) resultan 4 sub-bandas en vez de
dos de la descomposición unidimensional. Las 4
sub-bandas son llamadas coeficientes de aproximación CA, coeficientes de detalles horizontales
CDH, coeficientes de detalles verticales CDV y coeficientes de detalles diagonales CDD, las cuales
tienen aproximadamente un cuarto del número de
pixel de la imagen. Los coeficientes CA resultan de
la combinación de un filtro pasa bajo (FPB) en filas
y columnas, los coeficientes CDH resultan de la
combinación de FPB en las filas y un filtro pasa alto
(FPA) en las columnas, los coeficientes CDV resultan de aplicar FPA en las filas y FPB en las columnas, y los CDD se obtienen luego de FPA en filas y
columnas.
“XI Congreso Internacional de Informática en Salud 2016”
Rodríguez, F.; Rodríguez, N.; Aguilar, J.A. | “SISTEMA PARA EL ANÁLISIS AVANZADO DE IMÁGENES MÉDICAS DE TOMOGRAFÍA AXIAL COMPUTARIZADA (TAC)”
que tengan mayor valor absoluto. Esto reduce significativamente el tiempo de búsqueda y el espacio
utilizado para almacenar la información importante
de cada imagen. Permite que cambios poco significativos de las imagen de búsqueda como las distorsiones no sean consideradas en la similitud al
quedar mucha de esta información en los coeficientes eliminados.
2.6.3
Figura.3: Transformada wavelet de un nivel; (a):
detalles diagonales CDD, (b): detalles horizontales
CDH, (c): detalles verticales CDV, (d): aproximación
CA.
El mismo esquema descrito anteriormente se efectúa para obtener varios niveles de descomposición,
seleccionando la sub-banda de los coeficientes de
aproximación (CA) obtenidos y realizando todo el
procedimiento una vez más. El número de niveles
máximo depende de la longitud de la señal y del
tipo de filtro utilizado. Esta descomposición puede
ser vista como una representación de un árbol en la
cual la imagen original se encuentra en la raíz y es
descompuesta en L niveles con 3 nodos en cada
nivel intermedio y 4 nodos para el nivel L. Para
conformar la imagen de todos los coeficientes de
wavelet se obtienen las hojas del árbol.
La TDW tiene la propiedad de concentrar en pocos
coeficientes la información más significativa de la
imagen. En los coeficientes de aproximación van a
ir quedando la información de las zonas planas de
la imagen o zonas de variaciones de intensidad a
mayor escala, mientras que en los distintos niveles
de detalles estará representada la información de
los bordes, o sea, zonas donde existen cambios
importantes de intensidad a una escala relacionada
con el nivel de detalle en cada caso.
El algoritmo implementado sigue el diseño descrito
en [24], utilizando una wavelet madre de tipo Haar
en la descomposición de cada nivel. Para obtener
la firma de una imagen se procede a aplicar el proceso de extracción de características donde juegan
un papel importante los procedimientos de truncado
de coeficientes y la cuantificación. La firma resultante es indexada para la construcción de la base
de datos de coeficientes.
2.6.2
Truncado de coeficientes
Una vez realizada la TDW sobre la imagen se cuenta con una cantidad de coeficientes igual al número
de pixel de la imagen, lo cual es un número bastante grande incluso para imágenes relativamente
pequeñas. Conociendo que solo un conjunto de
coeficientes tienen un valor grande o significativo se
escogen los N coeficientes positivos o negativos
Cuantificación de coeficientes
Pequeñas diferencias en el resultado de la TDW,
producidas por distorsiones en las imágenes a
comparar pueden reducirse si los coeficientes
reales de la TDW se cuantifican como números
enteros. De esta forma dos valores muy cercanos
tendrían el mismo valor entero, por lo que se anularía la diferencia. Además el truncado puede incluir
coeficientes que no son significativos, y en este
caso la cuantificación le asignaría cero como valor.
La cuantificación actúa como proceso complementario del truncado, reduce el volumen de información y mejora el poder discriminante. Un caso extremo es cuando solo se asigna un nivel para cuantificar los coeficientes, de esta forma la cuantificación se convertiría en un proceso de umbralización,
en el cual los coeficientes que superan un umbral
serán tratados como unos y el resto como ceros.
La Figura 4 muestra el resultado de la ejecución de
la transformada de wavelet de 3 niveles y los procesos de truncado de coeficientes y la cuantificación.
Figura.4: (a): TDW de 3 niveles, (b) Espacio de características luego del truncado y la cuantificación.
Se observa en la Figura 4a que luego de ejecutada
la TDW se obtienen la misma cantidad de pixeles
que en la imagen original (Figura 3), con la diferencia de que la imagen resultante se encuentra transformada tanto en frecuencia como espacialmente,
dejando entre ver las variaciones más prominentes
que caracterizan a la imagen. Luego del truncado y
la cuantificación (Figura 4b) se obtienen los coeficientes con mayor valor modular que determinan
las variaciones más significativas. En la Figura 4b
se representan los coeficientes negativos con puntos verdes y los positivos con puntos blancos.
“XI Congreso Internacional de Informática en Salud 2016”
Rodríguez, F.; Rodríguez, N.; Aguilar, J.A. | “SISTEMA PARA EL ANÁLISIS AVANZADO DE IMÁGENES MÉDICAS DE TOMOGRAFÍA AXIAL COMPUTARIZADA (TAC)”
2.6.4 Estructura de la base de datos de
coeficientes
Después de los procesos de truncado y cuantificación, teniendo en cuenta que cada coeficiente de
detalle obtenido en la imagen de búsqueda solo
incide sobre las imágenes de la base de datos si en
la misma posición de pixel tiene un coeficiente significativo; resulta más eficiente para la búsqueda no
ordenar los coeficientes significativos de la base de
datos sino almacenarlos ordenados por posición.
De esta forma la base de datos de coeficientes será
una matriz del tamaño de las imágenes, donde se
almacenará en cada posición una lista con referencias a las imágenes que en esa posición tuvieron
coeficientes significativos.
Para construir la base de datos de coeficientes es
necesario un considerable poder de cómputo, debido a que es necesario ejecutar el procedimiento de
extracción de coeficientes en todas las imágenes
médicas de la base de datos de cada caso de estudio. Los coeficientes obtenidos se ordenan por posición en la matriz de la base de datos lo que facilita
la búsqueda de imágenes con coeficientes similares
de forma rápida.
disponibles en la barra de herramientas. El subsistema de reconocimiento provee las funcionalidades
para realizar búsquedas basadas en el contenido
de las imágenes; luego de la selección del tipo de
búsqueda que se realizará, que puede realizarse
seleccionando una zona de interés o la imagen
objetivo en su totalidad, este subsistema es capaz
de devolver una lista con las imágenes en la base
de datos con igual o parecido contenido visual lo
que beneficia al especialista el análisis de casos
anteriores que contengan las mismas características visuales que la imagen objetivo.
Figura.6: Describir niveles de TDW.
3. CONCLUSIONES
Figura.5: Estructura de la base de datos de coeficientes.
2.7 Interfaz de usuario del sistema
La aplicación desarrollada cuenta con las funcionalidades básicas de un sistema de procesamiento de
imágenes médicas, como los descritos en la introducción de este artículo. El software se ha diseñado
para su uso por usuarios con poca experiencia en
informática o procesamiento de imágenes y se encuentra dividido en 3 módulos: configuración, visor
y el sistema de reconocimiento.
El subsistema de configuración brinda una serie de
parámetros que facilitan la gestión de la configuración general. El visor permite visualizar y procesar
las imágenes médicas con las diferentes opciones
Favorecer el diagnóstico integral en los estudios
médicos de imagenología resulta de vital importancia para la agilización del estudio que llevan a cabo
los médicos. Es por esto que cualquier aporte en
ese sentido determina un impacto positivo con un
notable ahorro de recursos y tiempo.
El proceso de revisión de las imágenes de casos de
estudio por parte de los expertos conlleva un gran
flujo de imágenes a procesar y evaluar. En la realización de esta tarea convergen múltiples factores
que van desde la utilización de la herramienta de
visualización pasando por la experiencia del especialista, hasta la contrastación del diagnóstico de
casos anteriores con las mismas características.
Teniendo en cuenta la enorme cantidad de imágenes que se estudian en un caso, es deseable automatizar o facilitar en alguna medida el proceso de la
búsqueda de imágenes con características similares a las de una zona de interés.
El sistema propuesto posibilita la búsqueda de imágenes basada en contenido mediante la transformada de wavelet, además de otras opciones de
tratamiento de imágenes. El reconocimiento de
imágenes y su clasificación es una de las posibili-
“XI Congreso Internacional de Informática en Salud 2016”
Rodríguez, F.; Rodríguez, N.; Aguilar, J.A. | “SISTEMA PARA EL ANÁLISIS AVANZADO DE IMÁGENES MÉDICAS DE TOMOGRAFÍA AXIAL COMPUTARIZADA (TAC)”
dades que mejoran la usabilidad y el valor añadido
de los productos informáticos en esta área del conocimiento.
13.
4. AGRADECIMIENTOS
Los autores desean agradecer a los investigadores
del Centro de Estudios de Neurociencias, Procesamiento de Imágenes y Señales y a los especialistas del Centro de Informática Médica de la Universidad de las Ciencias Informáticas que de alguna
forma u otra han colaborado con la realización de
esta investigación.
5. REFERENCIAS BIBLIOGRÁFICAS
1. García Zoote, A.; Isaza, J.F.; Zapata, U.; Roldán, S.: Ejecución de un sistema piloto de teleradiología en Medellín, Colombia. ColombMed.
2006; 37(3):183-8.
2. Lee, J.S.; Tsai, C.T.; Pen, C.H.; Lu, H.C.: A real
time collaboration system for teleradiology consultation. Med Inform 2003; 72: 73-79.
3. J. Brossard, D. Ronda: Red territorial de
Transmisión de Imágenes Diagnósticas, XII Fórum Nacional de Ciencia y Técnica, 1998.
4. J. C. Mesias: Patris: Sistema Intra-hospitalario
de Imagenología y Telemedicina, XII Fórum Nacional de Ciencia y Técnica, 1998.
5. D. Ronda, O. Ferrer, N. A. Alvarez: iMagis:
Sistema para la transmisión de imágenes médicas multimodales, Memorias II Congreso Latinoamericano de Ingeniería Biomédica, 2001.
6. syngo fastView: Siemens AG Medical Solutions
[Disponible en: www.healthcare.siemens.com]
7. H. Blanco, A. Vázquez: Generalización del
sistema PACS iMagis, VII Congreso de la Sociedad Cubana de Bioingeniería, 2007.
8. Castro Márquez, C. L. y Delgado García A.:
Visor de imágenes médicas web, Revista Cubana de Informática Médica, vol. 6 no. 1, 2014.
9. Yong R., T. S. Huang and S. F. Chang: Image
Retrieval: Past, Present and Future. Journal of
Visual Communication and Image Representation. Vol. 10, pp.1-23, 1999.
10. Niblack W.; R. Barber; W. Equitz; M. Flicker;
E. Glasman; D. Petkovic; P. Yanker; C. Faloutsos and G. Taubin: The QBIC Project: Query images by content using color, texture and
shape. Storage and Retrieval for Images and
Video Databases. SPIE, pp.173-187, 1993.
11. Long, F.; H. Zhang and D. D. Feng: Multimedia
Information retrieval and Management. Technological Fundamentals and Applications, 2003.
12. Rodríguez, F.; Sanabria, F; Marañón, E; Análi-
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
sis comparativo de la transformada discreta de
wavelet y la transformada de wavelet packet en
la búsqueda de imágenes basada en contenido,
Congreso Internacional COMPUMAT 2013.
Dimov, D.; N. Zlateva and A. Marinov: CBIR
approach to face recognition. Institute of Information Technologies at Bulgarian Academy of
Sciences, 2009.
Lhotka, R.: Expert C# 2005 Business Objetcs,
Second Edition, Apress, 2006.
Jian Bo, T: Visual Studio 2013: Windows
Presentation Foundation, Official Microsoft
Learning Products – Trainer Edition, 2013.
Bradski, G.; Kaehler, A.: Learning OpenCV, pp.
109-141. Primera Edición. Septiembre 2008.
R.C. González y R.E. Woods: Digital Image
Processing, Prentice Hall, 2da Edición, 2002.
J. Vélez, Á. Sánchez, A.B. Moreno y J.L. Esteban: Visión por Computador, Ed. Dyckinson y
Serv. Public. URJC, 2003.
González E.: Contornos Activos, Monografías,
Universidad de Matanzas Camilo Cienfuegos,
2012.
Gutierrez, J.: Contornos Activos, bases teóricas, representación y minimización, Universidad
de Valencia, 1999.
Taubman, D. and M. Marcellin. JPEG200:
Standard for Interactive Imaging, IEEE Proc.,
Vol. 90, No. 8, 2002.
Yong, R., T. S. Huang and F. Shih: Image
Retrieval: Current Techniques, Promising Directions and Open Issues. J. of Visual Communication and Image Representation, pp. 39 – 62,
1999.
Apatean, A., A. Rogozan, S. Emerich, A.
BensrHair: Wavelets as Features for Objects
Recognition, 2009.
Stollnitz E. J., T. D. DeRose and D. H. Salesin:
Wavelet for Computer Graphics. Morgan Kauffmann Publishers. 1994.
6. SÍNTESIS CURRICULARES DE LOS AUTORES
Felipe Rodríguez Arias se graduó de Ingeniero en Ciencias Informáticas en el año 2009 en la Universidad de las Ciencias Informáticas. Está vinculado al desarrollo de software desde el año 2007. Ha
participado en proyectos internacionales de colaboración con Venezuela y con el Centro de Inmunología Molecular (CIM) en la
mejora de procesos ETL y minería de datos.Desde el año 2011 se
desempeña como profesor asistente e investigador del Grupo de
Visión por Computadoras en el Centro de Estudios de Neurociencias, Procesamiento de Imágenes y Señales (CENPIS), de la
Facultad de Ingeniería Eléctrica de la Universidad de Oriente. Ha
colaborado en la realización de varios proyectos científicos como el
Sistema Automatizado de Identificación Balística (SAIBal) en la
implementación del subsistema de reconocimiento de imágenes y
“XI Congreso Internacional de Informática en Salud 2016”
Rodríguez, F.; Rodríguez, N.; Aguilar, J.A. | “SISTEMA PARA EL ANÁLISIS AVANZADO DE IMÁGENES MÉDICAS DE TOMOGRAFÍA AXIAL COMPUTARIZADA (TAC)”
en la detección de objetos peligrosos en imágenes de rayos X de
inspección de equipajes. Es miembro de la Asociación Cubana de
Reconocimiento de Patrones (ACRP) desde 2012. Sus intereses
son el área del procesamiento de imágenes y reconocimiento de
patrones, la programación paralela para multiprocesadores (high
performance computing), la programación de propósito general en
unidades de procesamiento gráfico (GPGPU).
“XI Congreso Internacional de Informática en Salud 2016”
Descargar