Resumen: E-004 UNIVERSIDAD NACIONAL DEL NORDEST E Comunicaciones Científicas y Tecnológicas 2006 Aplicación de ICA con conceptos de estabilidad para separar señales. Alvarez Picaza, Carlos - Monzón, Jorge E. - Veglia, Jorge E. Departamento de Ingeniería, Facultad de Ciencias Exactas, UNNE 9 de Julio 1449 - (3400) Corrientes - Argentina Tel. (03783)-423126, Fax (03783)-473930, Email: cpicaza@exa.unne.edu.ar Antecedentes A menudo se ha utilizado el siguiente ejemplo: “supón que conversamos frente a un par de micrófonos. Salvo que hablemos por turnos, los micrófonos recogerán la superposición de nuestras voces. Pues bien, tomemos las grabaciones y tratemos de separar tu voz de la mía”. Esto es, a grandes rasgos, lo que se conoce como problema de “Separación Ciega de Fuentes”. Figura 1 Como muestra la Figura 1, el problema se plantea en los siguientes términos: un determinado proceso combina, superpone o, genéricamente, “mezcla” señales a las que se conoce como “fuentes”. Las señales mezcladas reciben el nombre de “observaciones”. El adjetivo “ciega” enfatiza el hecho de que, por hipótesis, tanto las fuentes como el proceso de mezcla son, en cada situación particular, desconocidos. En estas condiciones, se desea diseñar un sistema capaz de invertir todo el proceso de la mezcla y recuperar las fuentes. Las fuentes serán representadas por la letra s (del inglés ‘source’). Dadas M fuentes distintas, las distinguiremos nombrándolas como s1(t), ..., sM(t). Para manejarlas con comodidad, se agruparán en el vector s(t) que se define como s(t) = [ s1(t), ..., sM(t) ]T. Las observaciones serán representadas por la letra x. Dadas N observaciones, generalmente la salida de N sensores, se denotarán como x1(t), ..., xN(t) y serán agrupadas en el vector x(t) = [ x1(t), ..., xN(t) ]T. El sistema de separación nos devolverá M señales de salida y1(t), ..., yM(t) que deben reproducir fielmente a las fuentes. En una aplicación real, cabe esperar que el número de fuentes sea desconocido y, lo que es aún peor, varíe con el tiempo. No obstante, estos problemas serán tratados sólo de forma marginal. Finalmente, una pequeña precisión: es difícil distinguir entre fuente y ruido. En general, se considera que fuente es toda señal deseada que aparece en el registro de, al menos, dos sensores. Se considera que la mezcla es el proceso que transforma unas señales, las fuentes, en otras, las observaciones. Materiales y Métodos Sea el vector s(t) = [ s1(t), ..., sM(t) ]T que contiene a las M señales fuente, el vector x(t) = [ x1(t), ...,xN(t) ]T, con las N observaciones e y(t) = [ y1(t), ..., yM(t) ]T el vector que contiene las M salidas. Se dice que la mezcla es lineal e instantánea si: x(t) = A s(t) (1) Resumen: E-004 UNIVERSIDAD NACIONAL DEL NORDEST E Comunicaciones Científicas y Tecnológicas 2006 donde A es una matriz NxM que recibe el nombre de matriz de mezcla. Nótese que la transformación es lineal e invariante en el tiempo. Como se dijo antes, identificaremos N= Nº. de sensores . M= Nº. de fuentes . Por hipótesis, tanto A como s(t) son desconocidos y sólo se cuenta con las observaciones. Las salidas se determinan como y(t) = B x(t) (2) siendo B una matriz MxN, que recibe el nombre de matriz de separación. La relación que liga fuentes y salidas es, por lo tanto, y(t) = B x(t) = = B A s(t) = G s(t) (3) donde G es una matriz MxM a la que se llama matriz global de transferencia. La Figura 2 muestra la relación entre las distintas señales. Figura 2 Hay un par de indeterminaciones en este problema: - Si M = N y A es invertible, está claro que siempre podemos separar las fuentes: basta con que B sea la matriz inversa de A. - Si N > M, es decir, hay más sensores que fuentes y el rango de A es justamente M, reducimos este caso al anterior sin más que desechar la información de N − M de los sensores. - Si N < M, es decir, hay más fuentes que sensores o bien el rango de A es menor que el número de fuentes, no es posible encontrar una matriz B que consiga que la separación sea completa. Estabilidad Los conceptos de estabilidad e inestabilidad están presentes en la vida cotidiana. Es de uso común decir: el franco suizo es estable, el peso mexicano es inestable, el estado de salud de fulano es estable, etc. Incluso, en muchas áreas del conocimiento, se maneja dicho concepto de manera intuitiva, es común oír a un ingeniero decir que una estructura es estable o no lo es, un químico dice que una reacción se ha estabilizado, un economista suele decir que el precio de determinado producto es estable, un físico diría que el movimiento de una partícula es estable, etc. Pero un concepto que aparece frecuentemente en todas las ciencias, merece ser definido en términos precisos. No fue sino hasta 1892 cuando Aleksandr Lyapunov (1.857–1.918), matemático e ingeniero ruso que estableció las bases de la teoría que hoy lleva su nombre, formuló de manera precisa el concepto de estabilidad. Y ese ha sido el punto de partida para establecer otras variantes de tan importante concepto. Se debe ser capaz de predecir el comportamiento dinámico del sistema a partir del conocimiento de sus componentes. La característica más importante el comportamiento dinámico de un sistema es la estabilidad, es decir, si el sistema es estable o inestable. Un sistema está en equilibrio si, en ausencia de cualquier perturbación o entrada, la salida permanece en el mismo estado. Un sistema lineal e invariante con el tiempo es estable si la salida termina por regresar a su estado de equilibrio cuando el sistema está sujeto a una condición inicial. Es inestable si la salida diverge sin límite a partir de su estado de equilibrio cuando el sistema está sujeto a una condición inicial. Resumen: E-004 UNIVERSIDAD NACIONAL DEL NORDEST E Comunicaciones Científicas y Tecnológicas 2006 Considerando al corazón (sistema cardíaco) como un sistema biológico estable, utilizamos la Ecuación de Lyapunov: A M+MB=C El criterio de estabilidad se basa en encontrar M de esta ecuación, eligiendo previamente C. A(NxN) y B(MxM) son matrices constantes. Las matrices C y la incógnita M son NxM. (4) La ecuación (LYAP) es lineal en M y puede escribirse como sistemas de ecuaciones algebraicas en la forma estandar: (5) c=Gs Veamoslo para N= 3 y M= 2: a11 a12 a13 a21 a22 a23 a31 a32 a33 m11 m12 m21 m22 m31 m32 + m11 m12 m21 m22 m31 m32 b11 b12 b21 b22 c11 c12 c21 c22 c31 c32 = Haciendo las cuentas y expresando M y C como vectores apilando sus columnas, llegamos a: a11+b11 a21 a31 b12 0 0 a12 a22+b11 a32 0 b12 0 a13 a23 a33+b11 0 0 b12 b21 0 0 a11+b22 a21 a31 0 b21 0 a12 a22+b22 a32 0 0 b21 a13 a23 a33+b22 m11 m21 m31 m12 m22 m32 = c11 c21 c31 c12 c22 c32 Es decir, /A\ m = c, donde A es la matriz (NxM) x (NxM) de la ecuación anterior, y m y c son las matrices M y C convertidas a vectores (NxM) x 1. Como /A\ es cuadrada, esta ecuación tiene solución única si la matriz /A\ es invertible, es decir, si no tiene ningún autovalor nulo. Discusión de Resultados Aplicación Después de todo lo expresado, consideraremos un sistema estable, donde el número de señales coincide con el número de fuentes. Hallaremos la matriz incógnita M, la cual nos da una idea de cómo están mezcladas las señales. Nuestro Análisis de Componentes Independientes comprenderá descubrir las fuentes, separando las señales. Se utilizará la Ecuación de Lyapunov en donde: A M+MB=C C= c11 c12 c13 .......... c1500 c21 c22 c23 ...........c2500 es una matriz la cual contiene dos señales, las cuales se encuentran mezcladas. A= a11 a12 a21 a22 es una matriz de mezcla (random o Pascal) B= b11 b12 b13 ..........b1500 b21 b22 b23 ..........b2500 . . . . . . b5001 b5002 ..........b500500 es una matriz de mezcla (random o Pascal) Utilizando el programa MATLAB, introducimos dos señales y dos mezclas. Resumen: E-004 UNIVERSIDAD NACIONAL DEL NORDEST E Comunicaciones Científicas y Tecnológicas 2006 Figura 3 La figura 3 nos muestra una señal mezclada con dos fuentes (500 muestra), antes y después de la separación. Figura 4 La Figura 4 nos presenta ambas fuentes en forma individual, una señal senoidal y una diente de sierra. Conclusiones Nuestra matriz resultado M2x500 tiene dimensión 2x500. Por lo tanto no es inversible. Está compuesta por las mezclas impuestas por A y B. Para solucionar este inconveniente, aplicamos a esta matriz PCA (Análisis de Componentes Principales), obteniendo una matriz G, la cual contiene aproximadamente más del 98 % de información de la matriz M (original). G es una matriz cuadrada e inversible. En estas condiciones, las señales mezcladas pueden ser separadas. Entónces: S = G-1 C (6) Bibliografía Jutten C, Herault J: Independent Component Analysis versus Principal Component Analysis. EUSIPCO-1988, Signal processing IV, pp. 643-646, Grenoble, France, 1988. Estevan YP, Vielva L: Estimación de la matriz de mezclas en separación ciega de fuentes indeterminada con un número arbitrario de fuentes. España 2003. Ogata K: Ingeniería de Control Moderna. Editorial Prentice-Hall. Madrid, 2003. Puntonet, CG: Procedimientos y Aplicaciones en Separación de Señales. España 2.004. Rautenberg CM, D´Atellis CE: Control Lineal Avanzado y Control Óptimo. AADECA - Asociación Argentina de Contro Automático. Buenos Aires, 2004.