LA FUNCIÓN DE BASE RADIAL COMO UN MÉTODO PARA LA DETECCIÓN DE MICROCALCIFICACIONES EN IMÁGENES DE MAMOGRAFÍA José Augusto Moreno Escobar j.augusto.moreno@gmail.com Francisco Javier Gallegos Funes fgallegosf@ipn.mx SEPI-ESIME ZACATENCO, INSTITUTO POLITÉCNICO NACIONAL. AV. INSTITUTO POLITÉCNICO NACIONAL S/N, COL. LINDAVISTA, DEL. GUSTAVO A. MADERO. MÉXICO, D.F. TEL/FAX: 5729600, ext. 54622 RESUMEN Cada día crece más el uso de los métodos computarizados en el área de la medicina para ayudar como herramienta para realizar un diagnóstico más rápido, acertado y eficiente. Este hecho ha ayudado tanto a los médicos como a los pacientes, pues estos últimos no son sometidos a pruebas tan dolorosas y estresantes. Entre dichos sistemas se encuentran los algoritmos computacionales. Estos se han estado desarrollando para áreas como electroencefalografía y electrocardiografía, principalmente, y para mamografía. 1. INTRODUCCIÓN El cáncer de mama es un tumor maligno que aparece en cualquier parte de la glándula mamaria. Es el segundo cáncer más frecuente en México después del de cuello de la matriz o cáncer cervical. En Estados Unidos mueren 40,000 mujeres cada año por este cáncer 1. En nuestro país, aproximadamente el 6 % del total de los casos de cáncer en el país corresponde a este tipo de cáncer. Una de las maneras más eficientes usadas para la detección de este cáncer es la mamografía, que es un método para examinar los senos o mamas usando pequeñas dosis de radiación. Este simple procedimiento sirve para detectar tumores y quistes muy pequeños, imposibles de descubrir con un examen manual. Una de las desventajas que presenta la mamografía, como otros tipos diagnósticos para detectar cáncer, es que depende mucho de la apreciación de un médico especialista, la cual en ocasiones puede no ser la acertada, llevando así a desenlaces no agradables tanto para el médico como para el paciente. En la figura 1 se muestran 2 mamografías: una que no presenta anormalidades y otra que presenta un tumor. 1 Uno de cada 100 casos se presenta en la población masculina Figura 1 a. Mamografía que no presenta anormalidades Figura 1b. Mamografía presenta la presencia de un tumor 2. USO DE REDES NEURONALES ARTIFICIALES Las Redes Neuronales Artificiales (RNA) son sistemas de reconocimiento no paramétricos que pueden generalizar aprendiendo de ejemplos. Son particularmente útiles en problemas donde la toma de decisiones no sigue un patrón determinado y no se tiene un conocimiento explícito acerca de la función de densidad de probabilidad que gobierna al fenómeno. Es por ello que el uso de las RNA, particularmente para la detección de cáncer de mama, es ideal. 3. FUNCIÓN DE BASE RADIAL (RBF) Entre las redes neuronales consultadas, se escogió la función de base radial (del inglés radial basis function), pues esta presenta las siguientes ventajas: Usa un número mínimo de nodos en comparación con otras redes, reduciendo el número de cálculos para el aprendizaje. La arquitectura es simple (Solo 3 capas). Tienen amplia eficiencia en la fase de entrenamiento. Mejor desempeño con un mayor número de datos de entrenamiento. Varios algoritmos pueden ser empleados para encontrar los parámetros más apropiados para la RBF Buen clasificador de patrones. La RBF se puede definir de manera matemática como sigue: F x i x ci N (1) i 1 Donde x c i 1,2,..., N es un conjunto de funciones, generalmente no lineales, conocidas como i funciones radiales básicas, y denota una norma que usualmente es Euclidiana. i denota un factor de peso, N es el número de funciones radiales de la red F x es la salida que proporciona le red. Básicamente, la RBF se constituye de 3 capas (figura 2): Una capa de entrada, encargada de recibir los datos que se van a procesar. Esta capa puede estar constituida por sensores o transductores que adecuan las señales para que las pueda recibir la red neuronal; la segunda capa, o capa oculta, es la que se encarga de procesar los datos de acuerdo al tipo de función matemática que se tiene, como por ejemplo da función en (1), y una última capa de salida que es la que entrega el resultado que proporciona la red para la entrada dada. Capa de entrada Capa oculta Capa de salida Figura 2. Capas de una RBF 3.1 ¿CÓMO FUNCIONA UNA RBF? Los nodos ocultos, contienen 2 parámetros principales, que son: 1. Centro. Existe un centro para cada función radial involucrada en la capa oculta de la red, y es el punto en donde la función tiene un valor máximo. 2. Ancho. Es el término usado para identificar a la amplitud de la función radial identificada por la campana de Gauss. En la figura 3 se muestra una función (neurona) gaussiana, en donde se pueden apreciar el centro y el ancho se la misma. Ancho Centro Figura 3. Neurona gaussiana Primeramente, ingresa un vector de entrada x a través de la primera capa. Después, en la capa oculta se busca la distancia radial entre el centro de cada función gaussiana y el vector de entrada x, con n observaciones, d xc n x i 1 ci 2 i (2) El valor que se obtiene en (2) es una componente de la entrada para activar la función radial. En la capa oculta, en la medida que los valores de entrada se parezcan más a un centro su distancia tenderá a cero y de este modo la función gaussiana se dispararía a las vecindades de uno. Por otro lado, en la medida que los valores de entrada no se parezcan a su centro la distancia será mayor y la función radial parecería tender a cero. Este proceso es una clasificación no lineal de las entradas. Figura 4. Cálculos efectuados por una RBF 3.2. ENTRENAMIENTO DE UNA RBF En una RBF se usa un proceso de entrenamiento híbrido, que se compone principalmente de fase supervisada y fase no supervisada. El entrenamiento de la RBF ayuda a determinar los siguientes parámetros: Centro y ancho: la determinación de éstos parámetros se realiza mediante la optimización en el espacio de entradas, ya que cada neurona va a representar una zona diferente en dicho espacio. Esta parte del entrenamiento corresponde a la fase no supervisada. Para la determinación de centros se puede usar el algoritmo k-medias, y para el ancho se pueden calcular las distancias geométricas entre los centros de las funciones gaussianas, de manera que se evite el solapamiento entre funciones. Pesos: para la determinación de los pesos, la optimización se realiza en base a las salidas que se desea obtener. Esta parte corresponde a la fase supervisada del entrenamiento. Los pesos se pueden calcular mediante técnicas de minimización de error. 4. SEGMENTACIÓN Un paso importante antes de usar la red neuronal es escoger los datos que se le van a introducir. Es por eso que la imagen que se esta utilizando se debe de segmentar. Esto va ayuda a: Reducir información. Fijar una región de interés en la imagen. En este trabajo se utiliza la morfología , ya que es una herramienta para extraer componentes de una imagen que sean útiles en la representación y descripción de la forma de una región. Dos operaciones morfológicas importantes son la dilatación y la erosión. La dilatación adiciona píxeles a los límites de los objetos detectados, mientras que la erosión remueve píxeles de los límites de los objetos detectados. En el caso de las mamografías, las operaciones morfológicas nos permiten delimitar de una buena manera los objetos detectados. Para ejemplificar esto se usa la figura 1b: a) Mamografía presenta presencia de un tumor la b) Objeto detectado técnicas morfológicas usando c) Delimitación detectado en la original del objeto mamografía Figura 5. Segmentación de una mamografía Habiendo realizado una segmentación de datos adecuada, se introducirán RBF, para que esta pueda clasificarlos de acuerdo al propósito que en este trabajo, que aún está en desarrollo, se tiene. El diagrama propuesto del sistema se muestra en la figura 6. Mamografía digitalizada Pre-procesamiento (segmentación) Clasificador RBF Figura 6. Diagrama propuesto del sistema 4. CONCLUSIONES La investigación realizada hasta el momento nos permite ver que las RBF son buenos clasificadores, y que su fácil entrenamiento supone una implementación sencilla. Por otra parte, la segmentación que se usó en las imágenes de mamografía delimita de una manera adecuada los tumores. Esto es un gran a avance para este trabajo, pues la segmentación es fundamental para poder llegar a lograr el objetivo: la diferenciación entre mamografías que presentan algún tumor y las que no lo presentan. BIBLIOGRAFÍA [1] “Neural Networks, a comprehensive foundation”, 2nd Edition, Simon Haykin. Prentice Hall. 1999. pp. 256308. [2] IEEE Transactions on Medical Imaging, “Image Processing with Neural Networks-a review”, M. Egmont Petersen, D. de Ridder, H, Handels. Vol 35, No. 10, pp 2279-2301. 2002. [3] IEEE Transactions on Neural Networks, “On the Training of Radial Basis Function classifiers”, M. T. Musavi, W. Ahmed, K. H. Chan, K. B. Faris, D. M. Hummels. 1991. pp. 595-603. [4] IEEE Transactions on Neural Networks, “Median Radial Basis Function Neural Network”, Adrian G. Bors, Ioannis Pitas. 1996. pp. 1-33. [5] “Tratamiento Digital de Imágenes”, Rafael C. González, Richard E. Woods. Addison Wesley/Díaz de Santos. 1996. pp. 447-465, 478-502, 558-605.