Minería de datos clínicos y biológicos en el proyecto EU-ADR Laura I. Furlong Programa de Recerca en Informàtica Biomèdica (GRIB) IMIM (Institut de Recerca Hospital del Mar) Universitat Pompeu Fabra IV Conferencia Anual de las Plataformas Tecnológicas de Investigación Biomédica 28 de Febrero 2011 Uno de los objetivos del proyecto EU-ADR es el diseño, desarrollo y validación de un sistema computarizado de explotación de datos a partir de historias clínicas y bases de datos biomédicos para la detección temprana de efectos adversos a los medicamentos. Otro objetivo importante consiste en, una vez detectada una señal, proveer una explicación biológica plausible para cada señal: sustanciación de la señal Esquema de EU-ADR EHR EHR db IV EHR db III EHR db II db I Minería de textos Mapeo de terminologías Extracción de datos Minería de datos Detección de la señal Minería de textos Integración de datos Sustanciación de la señal Análisis de vías de señalización intracelular Farmacología in-silico Validación del sistema EHR dbs Lista de señales EHR dbs EHR dbs Extracción de datos Detección de la señal fármaco evento Señal Sustanciación de la señal fármaco evento metabolitos Gen/proteína Variantes de secuencia (SNPs) Vías de señalización intracelular Filtrado de la señal fármaco evento Filtrado de la señal Hay evidencias previas de la existencia de la señal? fármaco evento •Búsqueda en repositorios públicos (ej. DailyMed, DrugBank) mediante detección automática de pares fármaco-evento •Búsqueda en literatura biomédica mediante coocurrencia de conceptos y de asociaciones entre términos MeSH* *http://www.nlm.nih.gov/mesh/ Gen/proteína Sustanciación mediante proteínas fármaco metabolitos Sustanciación mediante vías de señalización evento Perfilado in silico de dianas de fármacos Cuáles son las dianas del fármaco? fármaco Proteína •Perfilado in silico de dianas de fármacos basado en el conocimiento previo de dianas de relevancia terapéutica. •Descriptores moleculares 2D y modelos basados en similitud estructural para perfilado de dianas de fármacos Perfilado in silico: metodología Fármaco ACL* SHED, PHRAG, FPD Descriptores moleculares 2D Matriz de asociaciones fármaco-diana Perfil de dianas *ACL: Annotated Chemical Library Asociaciones gen-enfermedad Qué genes están relacionados con el evento? Gen/proteína evento •Búsqueda de asociaciones gen-enfermedad utilizando la base de datos DisGeNET* •DisGeNET: • bases de datos revisadas por expertos (OMIM, PharmGKB, CTD, UniProt) • literatura biomédica mediante minería de textos *http://ibi.imim.es/DisGeNET/DisGeNETweb.html Red de asociación de genes alrededor de eventos de interés para EU-ADR Gen/proteína Sustanciación mediante proteínas fármaco metabolitos Sustanciación mediante vías de señalización evento Mapeo de proteínas a vías de señalización Vías de señalización intracelular En qué vías de señalización participan las dianas del fármaco y las proteínas asociadas al evento? Gen/proteína •Búsqueda en bases de datos públicas de vías de señalización intracelular (KEGG, Reactome) •Utilización de información acerca de la expresión de proteínas en tipos celulares y tejidos Implementación SOAP webservices In silico profiling Análisis Taverna workflows ketoprofeno Hemorragia gastrointestinal Perfilado in silico de dianas de fármacos Análisis de asociaciones gen-enfermedad hROAT1 NOS2 COX-1 COX-2 Interleukin-8 COX-1 ketoprofeno Hemorragia gastrointestinal Perfilado in silico de dianas de fármacos Análisis de asociaciones gen-enfermedad hROAT1 NOS2 COX-1 COX-2 Interleukin-8 COX-1 ketoprofeno Hemorragia gastrointestinal Perfilado in silico de dianas de fármacos Análisis de asociaciones gen-enfermedad hROAT1 hROAT1 ketoprofeno COX-1 COX-1 Sustanciación de la señal NOS2 NOS2 Hemorragia COX-2 gastrointestinal COX-2 binds to Interleukin-8 Interleukin-8 is associated to COX-1 COX-1 COX-1 Conclusiones Hemos desarrollado un marco conceptual y metodológico para la sustanciación automática de señales obtenidas mediante minería de datos de registros electrónicos de salud El sistema integra diferentes métodos bioinformáticos, tales como la minería de textos, el perfilado in silico de dianas y el análisis de vías de señalización. La sustanciación automática de señales de farmacovigilancia permitirá identificar las señales de mayor interés para su posterior evaluación. Agradecimientos