recuadro Genómica y transcriptómica para la generación de datos en Evolución • Gabriela Bedó Genómica. Sus objetivos Compilar todas las secuencias de un organismo Establecer la localización de los genes Establecer la función de los genes Generar perfiles de expresión en diferentes condiciones Conocer las proteínas producidas por los genes .......... Se nutre de los datos surgidos de la secuenciación de ADN. Aprovecha el desarrollo de métodos de secuenciación masiva que han permitido la secuenciación de genomas completos Secuenciación de próxima generación (Next Generation Sequencing o NGS) Las plataformas más utilizadas se basan en los siguientes pasos • Fragmentación del • • • ADN en pequeños trozos (30 a 700 pares de bases según la técnica) Amplificación de cada trozo por PCR generando clones Secuenciación de cada clon por rápidos métodos desarrollados año a año. Ensamblado Dos ejemplos En ambos casos se generan los fragmentos. Con todos ellos se prepara una “librería”. En diferentes soportes, estos fragmentos de amplifican numerosas veces por la técnica de PCR. Posteriormente se secuencian de distintas e ingeniosas formas: El método del Ion Torrent PSG se basa en la detección de cambios de pH inducidos por la liberación de un ion hidrógeno durante la incorporación de un nucleótido. El método del MiSeq de Illumina se basa en la detección de fluorescencia tras la incorporación de nucleótidos marcados fluorescentemente. Cada nucleótido fluoresce de forma diferente ADN genómico o ADNc Cortado en fragmentos pequeños, se prepara una “librería” Librería Cada fragmento se replica muchas veces por PCR amplificación Secuenciación ATAGTCAGCTG TAT C ATAGTCAGCTG TAT C La incorporación de un nucleótido produce un cambio de pH característico que es registrado La incorporación de un nucleótido produce una emisión de fluorescencia característica que es registrada La enorme cantidad de secuencias es publicada y ordenada en bases de datos Desarrollos a partir de la secuenciación de genomas Genética reversa Bioinformática Genómica funcional Análisis por genética reversa Es particularmente importante para utilizar los datos de los proyectos genoma Se basa en el hecho de que actualmente existen muchas secuencias de las que no se sabe su función. Ej: apenas un 10% de los genes humanos tienen asignada su función. Empieza con el gen clonado o proteína purificada y progresa hacia el conocimiento de su función. Para ello se basa generalmente en alterar la función del gen y realizar análisis fenotípico. Análisis funcional en genética reversa Anular el gen para conocer su función • Aprovecha modelos biológicos • En ellos disminuye la cantidad de producto del gen (“knock down”) o la anula totalmente (“knock out”). • También se puede sobreexpresar ese gen Organismo transgénico Tradicionalmente esto se logra introduciendo en el organismo: • • una versión alterada del gen que sustituye la original Una versión del gen que se expresa más o en otra ubicación • En ambos casos hablamos de organismo transgénico Otra alternativa: Uso de pequeños ARNs interferentes para inhibir la traducción o degradar el ARNm Pequeñas moléculas de ARN. En el complejo RISC se generan fragmentos de unos 20 nucleótidos complementarios a un ARNm. Al unirse al ARNm promueven su degradación o inhiben su traducción Transcripción ARN mensajero ARN pequeños (pueden sintetizarse en la misma célula o introducirse artificialmente) Complejo RISC Procesa los ARN intereferentes Los pequeños fragmentos de ARN interferente se unen a un ARNm por complementariedad de bases e inducen su degradación o inhiben su traducción Modelos Para estudiar los genes y los procesos que regulan las funciones biológicas, los genetistas experimentan en organismos modelo: fáciles de mantener en el laboratorio Generaciones cortas Progenie abundante Fácil de mutagenizar y aparear Organismos modelo Ratones (modelo de muchas enfermedades humanas) Mosca de la fruta Drosophila (con mutantes naturales, permitió mapeo e identificación de genes) Maíz Organismos modelo Saccharomyces cerevisae (levadura que se reproduce por gemación) Schizosccharomyces pombe (por fision) En otras áreas Caenorhabditis elegans Arabidopsis thaliana Pez cebra Para muchos de ellos se encuentran bases de datos con secuencias completas Cepas con deleciones y mutaciones específicas En Drosophila uso de elemento P (transposon) para introducir genes o como mutágeno Bioinformática Estudio de la información contenida en los genomas. Esa información incluye la suma de todas las secuencias que codifican para proteínas y RNAs, más los sitios de “señalización” que permiten su acción en el tiempo y tejido Programas estadísticos de “búsqueda de genes” que detecta secuencias consenso. Una secuencia entera, aun bien ensamblada está exenta de significado. Sin embargo muchas de las señales están conservadas: límites de los exones e intrones, señal de poliadenilación, sitios de unión de proteínas regulatorias en el promotor, etc. Es así que programas informáticos pueden ir identificando señales en la secuencia para caracterizar la presencia y estructura de los genes. AACTGCCTGGTTAC…………………………………………………ACGTCCGGAC El análisis de la secuencia buscando combinaciones de nucleótidos “consenso” que funcionan como señales permite darle sentido a la secuencia e identificar genes Sitio de unión de proteínas regulatorias Sitio de unión de la polimerasa Inicio de la traducción Sitio reconocimiento de splicing Terminación de la traducción Genómica funcional También pueden analizarse patrones genómicos de expresión génica e ir viendo todos los genes implicados en una función (genómica funcional) La genómica funcional permite a los investigadores identificar muchos genes cuyos niveles de expresión se encuentran modificados en determinados estados. La otra alternativa Conocer directamente el transcriptoma: …… Conjunto de transcriptos presentes en un organismo dado, en un tejido dado en determinadas condiciones El transcriptoma varía y cambia con las condiciones o estímulos Célula muscular ARN mensajeros Proteína actina Proteína miosina Ya no se describen los genes, sino los ARN mensajeros en cuanto a secuencia y abundancia. Célula pancreática ARN mensajeros Proteína insulina