Comparación de Técnicas de Separación de Fuentes para la Detección de Alternancias de Onda T en el ECG V. Monasterio1,2 , G. D. Clifford3 , J. P. Martı́nez2,1 1 CIBER de Bioingenierı́a Biomateriales y Nanomedicina Instituto de Investigación en Ingenierı́a de Aragón, Universidad de Zaragoza 3 Institute of Biomedical Engineering, Department of Engineering Science, University of Oxford, Oxford, UK violeta.monasterio@unizar.es 2 Resumen Las alternancias de onda T (TWA) son un fenómeno cardı́aco relacionado con los mecanismos causantes de arritmias ventriculares malignas. En este trabajo se evalúan diferentes técnicas de separación de fuentes para la detección multiderivacional de TWA en el electrocardiograma (ECG). Mediante un estudio de simulación, se comparan las técnicas del análisis de componentes periódicos (πCA) y la maximización del ratio espectral (SRM), basadas en la periodicidad de las fuentes, las técnicas FastICA y JADE, basadas en la independencia, y la técnica del análisis de componentes principales (PCA). Según los resultados de la simulación, las técnicas basadas en la periodicidad son las que ofrecen una mayor capacidad de detección de TWA. 1. Introducción Las alternancias de onda T (TWA) se definen como una fluctuación en la morfologı́a de la repolarización repetida cada dos latidos, y actualmente se consideran un posible marcador del riesgo de muerte súbita cardı́aca (MSC)[1]. Los principales métodos existentes para analizar TWA en el ECG operan según un esquema monoderivacional, es decir, analizan cada derivación del ECG de manera independiente [2]. En trabajos previos [3, 4], nuestro grupo presentó un esquema multiderivacional de análisis de TWA que mejora las prestaciones de técnicas monoderivacionales tales como el método espectral y el método del cociente de verosimilitudes para ruido Laplaciano (método LLR). En dicho esquema se separan las TWA de las componentes no alternantes del ECG para mejorar la detección de las TWA de muy baja amplitud. La búsqueda de una técnica de separación adecuada puede interpretarse como un problema de separación ciega de fuentes (BSS), una cuestión para la que se han propuesto técnicas como el análisis de componentes principales (PCA) o el análisis de componentes independientes (ICA). En trabajos previos se evaluó el uso de PCA [3] y del análisis de componentes periódicos (πCA) [4] como técnicas de separación para el análisis de TWA. En este trabajo se propone una nueva técnica de separación basada en la pe- riodicidad de la señal: la maximización del ratio espectral (SRM), y se evalúan dos técnicas de ICA: FastICA [5] y JADE [6]. La capacidad de detección de TWA obtenida con PCA, πCA, SRM, FastICA y JADE se compara mediante un estudio de simulación. 2. 2.1. Métodos Esquema multiderivacional general Para la detección de TWA se utiliza el esquema de análisis multiderivacional presentado anteriormente en [4]. Dicho esquema consta de tres etapas: preprocesado, transformación de la señal y detección de TWA (Fig. 1). En la etapa de preprocesado, la señal ECG multiderivacional se filtra paso-bajo y se diezma con una frecuencia de muestreo de 30 Hz. A continuación, se elimina la lı́nea de base utilizando la técnica de interpolación con splines cúbicos, y posteriormente se determinan las posiciones de los latidos con un algoritmo basado en wavelets [7]. En cada latido se selecciona un intervalo de 350 ms (complejo ST-T) para el análisis de TWA. Sea K el número de latidos de la ventana de análisis, N el número de muestras de cada complejo ST-T, y L el número de derivaciones. El complejo ST-T del latido k-ésimo en la derivación l-ésima se denota por h i xk,l = xk,l (0) . . . xk,l (N − 1) . Para cada derivación l, se concatenan los complejos ST-T para formar dos vectores: h i x̃l = x0,l . . . xK−1,l (1) h i x̃(m) = xm,l . . . xm+K−1,l l donde x̃(m) es el equivalente a x̃l obtenido tras desplazar la l ventana de análisis m latidos hacia delante. Finalmente, se construyen dos matrices juntando todas las derivaciones de la siguiente manera: (m) x̃1 x̃1 . (m) = .. ; = ... . (2) (m) x̃L x̃L Análisis de componentes periódicas ECG preprocesado transformación de la señal filtro detrending detección TWA 0 TWA / no TWA cálculo de la matriz de transformación Figura 1. Diagrama de bloques del esquema de análisis multiderivacional El objetivo de la segunda etapa es encontrar una transformación que separe las TWA del ruido. En primer lugar, los datos originales se filtran para eliminar el complejo ST-T medio con un filtro detrending 0 xk,l = 0,5 xk,l − xk−1,l , k = 1 ... K − 1 0 Con esta técnica se calcula la proyección ỹ = wT que maximiza la estructura periódica de la señal a la frecuencia de las TWA. Para ello se define la siguiente medida de periodicidad 0 0 2 ỹ (m) − ỹ (5) (w, m) = 0 2 ỹ donde m = 2 latidos es el periodo de las TWA. El peso w que minimiza (5) viene dado por el vector propio generalizado correspondiente al menor valor propio generalizado del par de matrices A0 , R0 , donde A0 es la autocorre0 0 lación espacial de (m) − [4, 10]. Es importante observar que la matriz Ψ calculada de esta manera solo contiene una columna w, ası́ que la señal transformada solo contendrá una derivación transformada. Esta única derivación transformada se puede interpretar como la proyección de la señal original en la dirección del espacio desde donde mejor se observa el contenido periódico de la señal. 0 y los segmentos obtenidos xk,l se concatenan y se apilan 0 0 como en (1) y (2) para formar las matrices and (m) . A continuación se calcula la matriz de transformación Ψ utilizando una de las técnicas descritas en la sección 2.2, y se aplica la señal original = ΨT (3) para obtener la matriz transformada . De aquı́ en adelante nos referiremos a la fila l-ésima de como derivación transformada l-ésima. Finalmente, en la tercera etapa se realiza la detección de TWA. Para decidir si existen alternancias o no, se aplica el método LLR a cada derivación transformada, calculando un estadı́stico a partir de los datos y comparándolo con un umbral de detección [8, 9]. El resultado final de la detección será positivo si se detectan TWA al menos en una derivación transformada. 2.2. Técnicas de separación En este estudio se comparan cuatro técnicas existentes para encontrar la matriz de transformación Ψ: PCA, πCA, FastICA, JADE, y se propone una nueva técnica, la maximización del ratio espectral (SRM). Maximización del ratio espectral 0 Al igual que πCA, esta técnica busca una proyección ỹ = 0 wT que maximice la periodicidad de la señal transformada. En este caso, la medida de periodicidad se define como S ỹ ( f0.5 ) ξ(w) = R (6) S ỹ ( f ) d f donde S ỹ ( f ) es la densidad espectral de potencia de la señal transformada, estimada con el periodograma modificado, y f0.5 es la frecuencia de las TWA (0.5 ciclos/latido). Para encontrar el peso w que maximiza (6) se utiliza el algoritmo de optimización basado en gradiente implementado por la rutina fminunc de MATLAB con las opciones por defecto. Se consideran dos alternativas para inicializar el algoritmo: el vector w = [1 0 . . . 0]T , que representa una proyección en el eje correspondiente a la primera derivación de la señal de entrada (esquema SRM), y la proyección w obtenida con πCA como se describe anteriormente (esquema πCA-SRM). Al igual que con πCA, la señal transformada sólo contendrá una derivación transformada. FastICA Análisis de componentes principales PCA separa las componentes ortogonales de la señal en orden descendente de varianza. En este caso, la transformación Ψ se obtiene resolviendo la ecuación R0 Ψ = ΨΛ (4) 1 0 0 T representa la estimación de (K − 1)N 0 la autocorrelación espacial de , Λ representa la matriz de valores propios, con los valores propios colocados en orden descendente, y Ψ representa la correspondiente matriz de vectores propios. donde R0 = FastICA es una de las técnicas de ICA más citadas en la literatura [5], y se distribuye libremente en [11]. Esta técnica calcula la transformación Ψ que maximiza la independencia de las componentes de la señal, basándose en la minimización de la información mutua entre las componentes y en un algoritmo de punto fijo. JADE JADE es otra de las técnicas más usadas de ICA, y está disponible públicamente en [12]. El algoritmo JADE [6] calcula la transformación que maximiza la independencia de las componentes de la señal por medio de la diagonalización conjunta de tensores de cumulantes de cuarto orden. 1 0.9 Estudio de simulación y resultados Para comparar el funcionamiento de las diferentes técnicas de separación, se utilizó un conjunto de señales ECG sintéticas con cantidades conocidas de TWA. Para generar las señales se usó un modelo de ECG multiderivacional [13], y se simularon TWA con amplitudes (Valt ) de 0 µV a 200 µV. Para cada valor de Valt se generaron 50 ECGs con las 3 derivaciones ortogonales de Frank, 5 min de duración, y una frecuencia de muestreo de 500 Hz. A cada ECG se le añadió ruido real, consistente en una suma de ruido de movimiento de electrodos (em), actividad muscular (ma) y lı́nea de base (bw) de la base de datos MIT-BIH Noise Stress Test [14]. Para cada ECG, se extrajo un fragmento aleatorio de 5 minutos de los registros em, ma y bw. Como estos registros sólo contienen dos derivaciones, se calculó una tercera derivación como la primera componente principal de las dos derivaciones existentes. El ruido de cada derivación se escaló para obtener una SNR de 20 dB con respecto al ECG y se sumó al ECG sintético. Las señales se procesaron con los esquemas PCA, πCA, SRM, πCA-SRM, FastICA y JADE utilizando una ventana de análisis deslizante de 32 latidos. El tiempo de ejecución (en segundos) para el análisis del conjunto completo de señales fue 64 s con PCA, 68 s con πCA, 6678 s con SRM, 5345 s con πCA-SRM, 1254 s con FastICA y 129 s con JADE. La capacidad de detección obtenida con los diferentes esquemas se comparó como sigue. Se definió la probabilidad de falsa alarma (PFA ) como el ratio entre el número de detecciones positivas de TWA en las señales con Valt = 0 (falsas detecciones) y el número total de decisiones tomadas en esas señales. La probabilidad de detección (PD ) se definió como el ratio entre el número de detecciones positivas en las señales con un Valt determinado y el número total de decisiones tomado en esas señales. Para cada esquema, se fijó un umbral de detección correspondiente a una PFA = 0,01, y se comparó la PD resultante. Las mejores prestaciones se obtuvieron con los esquemas πCA, SRM y πCA-SRM, que presentaron una PD similar para todos los Valt (Fig. 2). Las direcciones de proyección obtenidas con πCA, SRM y πCA-SRM también se analizaron. Para cada Valt , los vectores w obtenidos con cada técnica se normalizaron y se promediaron. Las direcciones medias obtenidas con SRM and πCA-SRM coincidieron en todos los casos. Las direcciones medias obtenidas con πCA y SRM fueron ligeramente diferentes para Valt bajos (Fig. 3(a)), y la diferencia entre ellas desapareció al aumentar Valt (Fig. 3(b)). 4. Discusión y conclusiones La mejor capacidad de detección se obtiene con los esquemas basados en la periodicidad. Tanto πCA como SRM buscan la proyección que maximiza la periodicidad de la señal, siguiendo criterios temporales y espectrales respec- 0.8 0.7 0.6 PD 3. 0.5 0.4 PCA πCA SRM πCA−SRM FastICA JADE 0.3 0.2 0.1 0 0 50 100 150 200 Valt (µV) Figura 2. PD de los diferentes esquemas en función de la amplitud de las TWA. PFA = 0,01 para todos los esquemas. tivamente. Ambos criterios producen resultados equivalentes en cuanto a detección, ya que las direcciones obtenidas con los dos esquemas convergen al aumentar Valt , e incluso cuando las direcciones no coinciden (Valt bajos), son lo suficientemente parecidas como para producir la misma PD . Las proyecciones obtenidas con SRM y πCA-SRM coinciden en todos los casos. La inicialización del algoritmo de optimización con πCA (esquema πCA-SRM) no afecta al resultado final y reduce el tiempo de convergencia porque se parte de un punto más cercano a la solución. No obstante, la naturaleza iterativa del algoritmo de maximización provoca que el tiempo total de ejecución de los esquemas SRM y πCA-SRM sea mucho mayor que el del esquema πCA simple. PCA es el esquema más rápido de los cinco, aunque los tiempos de ejecución de PCA y πCA son comparables. El criterio de máxima varianza seguido por PCA produce un efecto de eliminación de ruido que mejora la detección de TWA frente a un esquema monoderivacional convencional [3]. Esta mejora, sin embargo, no es suficiente para superar las prestaciones de los esquemas basados en la periodicidad. Los algoritmos FastICA y JADE presentan la peor capacidad de detección entre los esquemas comparados. ICA se ha utilizado con éxito en el procesado de ECGs para otras aplicaciones [15], pero, según los resultados de este estudio, no es la mejor opción para el análisis de TWA. Los algoritmos FastICA y JADE están basados en el modelo ICA clásico, que supone que la señal de entrada es una mezcla lineal estacionaria e instantánea de un número de fuentes independientes igual al número de canales de la señal. En el caso del análisis de TWA en ECGs de tres derivaciones, resulta poco realista suponer la existencia de sólo tres fuentes, que además sean independientes entre sı́, porque la señal después de la etapa de preprocesado todavı́a puede contener, además de las TWA, ruido de diferentes tipos y residuos de la actividad normal de los ventrı́culos que no proyección en el plano XY (a) proyección en el plano XZ 1 proyección en el plano YZ 1 1 0 0 0.5 X 0.5 0 1 Z 0.5 Z Y CA SRM CA-SRM 0 proyección en el plano XY (b) 0.5 X 0.5 0 1 0 proyección en el plano XZ 1 0.5 Y 1 proyección en el plano YZ 1 1 0 0 0.5 X 1 0.5 0 Z 0.5 Z Y CA SRM CA-SRM 0 0.5 X 1 0.5 0 0 0.5 Y 1 Figura 3. Dirección media de la proyección obtenida con πCA (cuadrados), SRM (rombos) y πCA-SRM (asteriscos) en señales con (a) Valt =10 µV y (b) Valt =60 µV. hayan sido cancelados totalmente por el filtro detrending. Los algoritmos de ICA podrı́an producir mejores resultados en ECGs de 12 derivaciones, como los que se obtienen en los test de TWA en pruebas de esfuerzo, pero los resultados muestran que su utilidad en registros ambulatorios de 2 ó 3 derivaciones es limitada. Según este estudio, la opción preferida para registros ambulatorios deberı́a ser el esquema πCA. Agradecimientos Este trabajo ha recibido el apoyo de TEC-2007-68076-C02-02 de CICYT, y GTC T-30 de la DGA. El CIBER-BBN es una iniciativa enmarcada en el VI Plan Nacional I+D+i 2008-2011, Iniciativa Ingenio 2010, programa Consolider, Acciones CIBER y financiada por el Instituto de Salud Carlos III con ayuda del Fondo Europeo de Desarrollo Regional. Referencias [1] Narayan SM. T-wave alternans and the susceptibility to ventricular arrhythmias. J Am Coll Cardiol 2006; 47(2):269–281. [2] Martı́nez JP, Olmos S. Methodological principles of T wave alternans analysis: a unified framework. IEEE Trans Biomed Eng 2005;52:599–613. [3] Monasterio V, Laguna P, Martı́nez JP. Multilead analysis of T-wave alternans in the ECG using principal component analysis. IEEE Trans Biomed Eng 2009;57(7):1880–1890. [4] Monasterio V, Clifford GD, Laguna P, Martı́nez JP. A multilead scheme based on periodic component analysis for T wave alternans analysis in the ECG. Ann Biomed Eng 2010; 38(8):2532–2541. [5] Hyvärinen A. Fast and robust fixed-point algorithms for independent component analysis. IEEE Trans Neural Netw 1999;10(3):626–634. [6] Cardoso JF, Souloumiac A. Blind beamforming for non Gaussian signals. IEE Proceedings F December 1993; 140(6):362–370. [7] Martı́nez JP, Almeida R, Olmos S, Rocha AP, Laguna P. A wavelet-based ECG delineator: evaluation on standard databases. IEEE Trans Biomed Eng 2004;51(4):570–581. [8] Martı́nez JP, Olmos S. Detection of T wave alternans in nonstationary noise: a GLRT approach. In Computers in Cardiology 2003. IEEE Comp. Soc. Press, 2003; 161–164. [9] Martı́nez JP, Olmos S, Wagner G, Laguna P. Characterization of repolarization alternans during ischemia: timecourse and spatial analysis. IEEE Trans Biomed Eng 2006; 53:701–711. [10] Saul LK, Allen JB. Periodic component analysis: an eigenvalue method for representing periodic structure in speech. NIPS 2000;807–813. [11] FastICA Matlab package. URL http://www.cis.hut. fi/projects/ica/fastica. [12] ICA Central. URL http://www.tsi.enst.fr/ icacentral/algos.html. [13] Clifford GD, Nemati S, Sameni R. An artificial multichannel model for generating abnormal electrocardiographic rhythms. IOP Physiol Meas Apr 2010;31(4). [14] Moody GB, Muldrow W, Mark RG. A noise stress test for arrhythmia detectors. In Computers in Cardiology 1984, volume 11. IEEE Comp. Soc. Press, 1984; 381–384. [15] Castells F, Cebrián A, Millet J. The role of independent component analysis in the signal processing of ECG recordings. Biomedizinische TechnikBiomedical Engineering 2007;52(1):18–24.