Redes de regulación Guillermo Carbajosa Resumen • Introducción a la transcripción y su regulación • Redes de regulación: Definición • Encontrando Sitios de Unión: • Conocidos (Pattern Matching) • Nuevos (Pattern Discovering) Resumen II • Propiedades de las redes de regulación • Propiedades generales • Motivos • Evolución • Dinámica Regulación de la transcripción • • Resultado de la interacción entre proteínas y DNA El conjunto de proteínas que se unan a su región promotora (directa o indirectamente) va a determinar la expresión de un gen: • • • En que tejidos En que fase del desarrollo Bajo que condiciones ambientales Transcripción en bacterias Transcripción en bacterias: Operones Transcripción en Eucariotas Otras fuentes de regulación • Elongación • Estabilidad del ARNm • Micro ARN • etc... Redes de regulación Redes de regulación II Definiendo redes de regulación Lee at al. 2002 Science 298:799-804 Computacionalmente • Sitios de unión al ADN conocidos: “Pattern Matching” • • “¿Qué genes regula un factor de transcripción?” Si sabemos la secuencia a la que se une un factor de transcripción, ¿podemos encontrar donde se une en un genoma? Sitios de unión al ADN desconocidos: “Pattern Discovering” • “¿Qué sitios de unión regulan un conjunto de genes?” Si sabemos que un conjunto de genes está co-regulado, ¿podemos encontrar los sitios de unión al ADN responsables de su regulación? Buscando sitios conocidos • Descripción de un sitio de unión • Secuencias consenso • Patrones • Matrices Secuencias consenso Sitios determinados Experimantalmente Secuencia Consenso ATCGTGCTATAGGTAAGT ATCGTGGTATACGTAAGT ATCGTGCTTTAGGTAAGA ATCCTGCTATTGCTAAGT ATCGTGCTATAGGTAAGT Secuencias consenso II ACGTA CGACGTAGATGACCTACGGATGCACGAACG CGACGTAGATGACCTACGGATGCACGAACG CGACGTAGATGACCTACGGATGCACGAACG CGACGTAGATGACCTACGGATGCACGAACG Patrones ATCGTGCTATAGGTAAGT ATCGAGGTATAGGTAAGT ATGGGGCTACAGGTAAGA ATGGCGCTATTGGTAAGT AT[CG][ACGT]G[CG]TA[CT][AT]GGTAAG[AT] ATSGNGSTAYWGGTAAGW W= R= K= S= Y= M= A A G C C A or or or or or or T G T G T C Matrices A C G T A A A A T T T T C C C C G G G C T T T T G G G G C G C C T T T T A A T A T T T T A A A T G C G G G G G C T T T T A A A A A A A A G G G G T T A T 4 0 0 0 0 0 0 4 0 4 0 0 0 1 3 0 0 0 0 4 0 0 4 0 0 3 1 0 0 0 0 4 3 0 0 1 0 0 0 4 3 0 0 1 0 1 3 0 0 1 3 0 0 0 0 4 4 0 0 0 4 0 0 0 0 0 4 0 1 0 0 3 A T G G C T C G A T T G G T A T G T 4+4+0+3+0+4+3+0+3+4+1+3+3+4+4+0+4+3=47 T A G C C A G T T T A T T A G C G T 0+0+0+1+0+0+3+4+1+4+3+0+0+0+0+0+4+3=23 Logos • Representación gráfica de un alineamiento • La altura de cada base es proporcional a su frecuencia • La altura de cada posición es proporcional a su conservación (medido en bits de información) ✴http://weblogo.berkeley.edu/logo.cgi Sitios especiales • • Promotores • • http://www.fruitfly.org/seq_tools/promoter.html • http://www.cbs.dtu.dk/services/Promoter/ http://www.softberry.com/berry.phtml? topic=bprom&group=programs&subgroup=gfindb Terminadores • http://www.softberry.com/berry.phtml? topic=findterm&group=programs&subgroup=gfindb • http://cbcb.umd.edu/software/transterm/ Bases de datos • Factores de transcripción, sitios de unión y sus matrices en eucariotas • Bases de datos y programas relacionados • PathoDB: una base de datos de formas mutadas relevantes de factores de transcripción y sitios de unión • S/Mart: información sobre las regiones unidas al anclaje y la matriz nuclear y las proteínas de la matriz nuclear • Transcompel: una base de datos de elementos regulatorios complejos que afectan a la transcripción en eucariotas ✴http://www.gene-regulation.com/ RegulonDB • Factores de transcripción, sus sitios de unión y sus operones en E. coli • Herramientas de visualización y análisis • Integrado en Ecocyc (www.ecocyc.org) ✴http://www.cifn.unam.mx/Computational_Genomics/regulondb/ Otras bases de datos • TRED: Humanos y ratón • CEPDB: C. elegans • SCPD: Levaduras • Promotores, sitios de unión, matrices, etc... ✴http://rulai.cshl.edu/software/index1.htm Encontrando sitios • Se necesita un conjunto de genes que se cree/sabe que está co-regulado • Se toman las regiones promotoras • Se buscan posibles regiones reguladoras Genes co-regulados • Perfiles transcripcionales (microarrays) • Otro tipo de asociaciones: • Rutas metabólicas • Misma clasificación funcional • Genes ortólogos (“huella filogenética”) Microarrays 1. Cada experimento compara 2 condiciones 2. Se necesitan varios experimentos 3. Para cada gen se obtiene un perfil 4. Los perfiles se comparan 5. Los genes se agrupan en función de sus perfiles Huella filogenética • • Se obtienen grupos de genes ortólogos • • Organismos distantes: no hay conservación Se asume que la regulación esta conservada, al igual que los sitios de unión Organismos cercanos: las secuencias no funcionales no han divergido aún Métodos • Motivos sobre-representados • • • • Computacionalmente caro Exhaustivo Ruidoso Basado en matrices • Rápido • • Consensus, MAME Gibbs sampling • • no exhaustivo, pueden obtenerse resultados distintos cada vez Filtrado por simetría Motivos Sobrerepresentados 1. Calcular la frecuencia de cada palabra de longitud n-bases en nuestras secuencias 2. Determinar aquellas que son significativamente más abundantes en nuestro grupo que en otros grupos Secuencia Esperado Observado AAAAA 2 3 AAAAC 3 2 AAAAG 5 3 ATGCA 13 17 ATGCC 15 143 ATGCG 17 14 2 0 ... ... TTTGC Gibbs Sampling 1. Selecciona al azar ACGTAGGTTC ACGTAGCAGT ACGGATGCGA ACGTAGCGTA 2. Eliminar la peor del alineamiento ACGTAGGTTC ACGTAGCAGT ACGGATGCGA ACGTAGCGTA 3. Sustituir por la mejor en la misma secuencia ACGTAGGATC ACGTAGCAGT ACGGATGCGA ACGTAGCGTA Repetir hasta que se estabiliza la calidad del alineamiento ACGTAGGATC ACGTAGCAGT ACGGATGCGA ACGTAGCGTA Agrupando sitios • Motivos que solapan • Motivos que se parecen AAGTCGGC AGTCGGCT GTCGGCTT -----------AAGTCGGCTT AGTCGGCA AGTCGGCT TGTCGGCT -----------AGTCGGCT Flujo de trabajo Pattern Discovery Pattern Matching Motive Clustering Propiedades de la red de regulación Propiedades Generales • Distribución exponencial • Distribución “Ley de potencias” • • • “Libre de escala” Robustez Caminos cortos (integración de señal) Evolución de las redes Duplicación y Evolución Duplicación de TFBS Red de Co-regulación • • • • gamma =~1 c=0.6 “libre de escala” “mundo pequeño” Simulando la evolución Simulando la evolución II • En ausencia de selección pueden aparecer redes de propiedades similares a las reales Motivos Motivos II • Algunas topologías (motivos) aparecen con mucha frecuencia Milo et al, 2002. Science 298:824 Motivos específicos Evolución de motivos No: En E coli no hay reguladores homólogos con el mismo motivo Evolución de motivos II Conant & Wagner,2003. Nat Genet. 34:264 Propiedades de los motivos Shen-Orr et al,2002. Nat Genet. 31:64 Circuitos Tyler et al. 2003 Current Opinion in Cell Biology 15:221 Las redes son dinámicas Luscombe et al., 2004 Nature 431:308 Las redes son dinámicas II Luscombe et al., 2004 Nature 431:308 ¡Gracias por vuestra atención! (y a Ildefonso Cases por la presentación) ¿Preguntas? Prácticas: • http://rsat.scmbb.ulb.ac.be/rsat/ • Misc>Tutorials • • 1. Sequence retrieval 3. Pattern matching • • 3.2. Patser 4. Pattern discovering • • 4.1.1. Oligo analysis 4.2.1. Gibbs Motif Sampler