Proteómica y sus aplicaciones Conceptos básicos en proteómica aplicaciones metodologías Electroforésis en dos dimensiones MALDI-TOF/ Esi LC-MS/MS Aplicaciones de la proteómica al estudio de la tuberculosis y la paratuberculosis Genómica Funcional: Utilización de aproximaciones experimentales globales para el entendimiento de las funciones de genes y/o proteínas, que permiten establecer vías genéticas integradas que gobiernan la fisiología de un organismo Ofrece una imagen completa de las interacciones entre miles de genes o productos génicos simultáneamente en función de una situación particular Transcriptómica Variación del genoma Polimorfismos SNPs Salud y Sanidad Medio Ambiente Producción Proteómica Metabolómica Bioinformática Interacción de proteínas Sistemas de Doble hibrido Organización en redes interconectadas Biología estructural Expresión de proteínas Cristalización, X-ray Función de proteínas Organismos modelo Manipulación génica Knockout, RNAi Nuevos fenotipos Porque estudiar las proteínas ? El genoma y los transcriptomas no son suficientes para modelar y predecir sistemas biológicos. Las modificaciones postraduccionales tales como la fosforilación y el clivaje proteolítico frecuentemente regulan la actividad de las proteínas. La cantidad de proteína en una célula no siempre es regulada por la expresión del RNA mensajero. En vez, la traducción y la degradación pueden determinar la abundancia de las proteínas. Principales aplicaciones de la proteómica Perfil de proteínas (identificación de proteínas a gran escala) Proteómica comparativa Proteómica funcional (interacción proteína-proteína) Proteómica Gran rango dinámico (posibilita identificar proteínas de abundancia muy baja en presencia de proteínas de abundancia muy alta) Amplio rango de pesos moleculares (750 kDa to 350 Da) • de pI (3 to 12) • de hidrofobicidad Algunas limitaciones en los estudios proteómicos…. • Las tecnologías proteómicas no han sido tan desarrolladas como las genómicas principalmente debido a la falta de esquemas de amplificación como la PCR. • Solo se pueden analizar proteínas de su fuente natural. • La complejidad de los proteomas se debe a que muchas proteínas son procesadas y modificadas de forma compleja y pueden ser producto de splicing diferencial. Perfiles proteómicos comparativos Geles de 2D LC2D Muestra (células, tejidos, fluidos) Shotgun Análisis Electroforésis de proteínas en dos dimensiones (2-DE) Purificar las proteínas del tejido o células Separar las proteínas en 1 dimensión por su PI Separar las proteínas en 2 dimensiones por su peso molecular Tinción de las proteínas, análisis de los spots Identificación de las proteínas por MS Métodos de separación Electroforésis en una dimensión Isoelectroenfoque de las proteínas Solubilización de las proteínas para geles de 2D Objetivos Romper las inteacciones moleculares (puestes disulfuro). prevenir cualquier modificación artificial de las proteínas en el medio. Remover cualquier sustancia que pueda interferir con las 2D. Mantener las proteínas en solución durante el proceso de 2D. No hay un protocolo de solubilización universal. Las mezclas de urea-reductoresdetergentes generalmente logran romper los puentes disulfuro y las interacciones no-covalentes. Solubilización de las proteínas para geles de 2D Agentes caotrópicos (Estos agentes interfieren con los enlaces no covalentes ) 8-7M UREA 2M TIOUREA Surfactantes (Bajan la tensión superficial) 4-2% CHAPS Agentes Reductores (Reduce a un agente oxidante traspasándole electrones a este último) 65 -100mM DDT Anfolitos 2% Isoelectroenfoque (1ª dimensión) SDS PAGE (2ª dimensión) Tiras para isoelectroenfoque individuales comerciales 1.Re hidratación de la tiras (12hs) 2.Se aplica la muestra de proteínas 3.Se separan la proteínas en las tiras por corrida electroforética a alto V Separación de las proteínas por peso molecular Procedimiento: 1.Preparado de los geles (12%) 2. Equilibrado de las tiras de la primera dimensión 3. Cargado de la tira en el SDS PAGE 4. Sellado con agarosa 5. Separación de las proteínas por electroforésis según su peso molecular 6. Tinción de los geles 7. Toma de la imagen 8. Análisis de spots (manualmente o con programas informáticos) Métodos Generales de Tinción Tinción con nitrato de plata Tinción con Coomassie blue (R and G) Métodos de marcado radioactivo Métodos fluorescentes Expresión diferencial de proteínas RESUMEN DEL ANALISIS DE EXPRESSION DIFERENCIAL DE PROTEINAS Para cuantificar cambios en los niveles de proteínas se utiliza marcación fluorescente Análisis de imágenes Detección de spots Condición control Con tratamiento Superposición de perfiles http://expasy.org/melanie/ Aislado de las proteínas del gel 2D Manual Automático Digestión en gel: • Lavado • Deshidratación y secado • Digestión enzimática • Extracción • Desalado y concentración de los péptidos Identificación de proteínas por 2-DG Digestión en gel Espectrometría de masas Base de datos de secuencias de proteínas/ADN www.us.expasy.org Reactivos químicos y enzimas empleadas para el mapeo de péptidos Espectrometría de masas Fuente de iones + Acelerador Analizador de masas Detector Electron impact (EI) Chemical Ionization (CI) Fast Atom Bombardment (FAB) Matrix Assisted Laser Desorption/ Ionization (MALDI) Electropsray Ionization (ESI) Magnetic Sector Fourier Transform Ion Cyclotron Resonance (FTICR) Quadrupole Ion Trap Time-of-Flight (TOF) MALDI es uno de los métodos para ionizar péptidos y otras moléculas En MALDI las muestras son depositadas en una matriz que absorbe UV, la cual capta la energía láser, ioniza y protona las moléculas de la muestra Matrix Assisted Laser Desorption Time-of-Flight Mass spectrometer (MALDI-TOF-MS) Sample probe Relative Intensity 335 nm nitrogen + Field free drift region Detector + + MH+ MH+ MH+ m/z MALDI generalmente se usa con espectrómetros TOF (tiempo de vuelo) 1570.673 1571.673 1572.673 1573.673 1574.673 Espectro de masas TOF Espectro de masas de una mezcla de 11 péptidos Identificación de proteínas por el mapa peptídico (datos del MALDI-TOF) Gel 2DE Proteína intacta Proteólisis experimental MS Experimental Análisis informático MS Teórico Base de datos de ADN Base de datos de proteínas Proteólisis teórica SELDI – Surface-Enhanced Laser Desorption and Ionization Es una extensión de: MALDI – Matrix-assisted laser desorption/ionization Como en MALDT TOF, en SELDI TOF; • Las proteínas son co cristalizadas con una matriz que absorve UV • Son vaporizadas por un pulso de UV laser • Las proteína ionizadas son aceleradas en un campo eléctrico • Se mide la relación carga/masa de las proteínas 36 Que hacer cuando no la tecnología de geles de 2D no es aplicable? Proteínas de membrana Baja abundancia de la proteína Resolución de la proteína blanco poco satisfactoria Baja homología con secuencias depositadas en bases de datos Metodología alternativa a 2D MALDI-TOF es Esi LC MS/MS Perfiles proteómicos comparativos Geles de 2D LC2D Muestra (células, tejidos, fluidos) Shotgun Análisis IONIZACION POR ELECTRO ESPRAY TANDEM MS/MS Secuenciación de proteínas Usa Tandem MS: dos analizadores de masa en series con una celda de colisión entre ellos Celdas de Colisión: región donde los iones colisionan con un gas (He, Ne, Ar) resultando en la fragmentación del ion La fragmentación de los pétidos ocurre de forma predecible, principalmente en la unión peptídica Los iones hijos resultante poseen masas que son consistentes con pesos moleculares conocidos de dipéptidos, tripéptidos, etc. Ser-Glu-Leu-Ile-Arg-Trp Celda de colisión Ser-Glu-Leu-Ile-Arg Ser-Glu-Leu-Ile Ser-Glu-Leu Etc… Comparación entre MALDI-TOF y ESI-MSMS para la identificación de proteínas MALDI-TOF MS Muestra en un soporte (matriz cristalina). Los espectros indican masas de los péptidos. La identificación de la proteína es por MS es por huella peptídica. Requiere la secuencia del proteoma. ESI-MS-MS Muestra en solución (HPLC). Los espectros MS-MS revelan patrones de fragmentación. Se identifica la proteína por algoritmos de correlación cruzada. Síntesis de novo. Ejemplo de un reactivo ICAT Biotin Affinity tag: Se une a la resina de estreptavidinaagarosa Reactive group: Grupo tiol reactivo que se une a la cisteína O Linker: La versión pesada tiene deuterio en* La versión liviana tiene hidrógeno en* NH NH H N * S O * O O * O * H N I O ComoAislamiento funciona ICAT? por afinidad a bolitas de estreptavidina Lisado y marcado Quantificación MS NH2-EACDPLRCOOH 100 liviano 100 MIX Identificación MS/MS pesado Proteolisis (eg tripsina) 0 0 550 570 m/z 590 200 400 m/z 600 Ventajas vs. desventajas Estima los niveles relativos de una proteína entre muestras con bastante presición (10%) Se puede usar en mezclas complejas de proteínas Si se usa MS-MS los péptidos se pueden identificar directamente • Caro • Fragmentación de los Tag • Solo para péptidos con cisteína. HERRAMIENTAS EXPASY http://expasy.org/tools/#proteome Similarity searches ExPASy BLAST Pattern and profile searches translational modification prediction Topology prediction Primary structure analysis Secondary structure prediction Tertiary structure analysis and prediction Molecular modeling and visualization ExPASy Proteomics tools Protein identification and characterization Identification and characterization with peptide mass fingerprinting data Aldente - Identify proteins with peptide mass fingerprinting data.A new, fast and powerful tool that takes advantage of Hough transformation for spectra recalibration and outlier exclusion.Download the stand-alone version FindMod - Predict potential protein post-translational modifications and potential single amino acid substitutions in peptides.Experimentally measured peptide masses are compared with the theoretical pept ides calculated from a specified Swiss-Prot entry or from a user-entered sequence, and mass differences are used to better characterize the protein of interest. FindPept - Identify peptides that result from unspecific cleavage of proteins from their experimental masses, taking into account artefactual chemical modifications, post-translational modifications (PTM) and protease autolytic cleavage Mascot- Peptide mass fingerprint from Matrix Science Ltd., London PepMAPPER - Peptide mass fingerprinting tool from UMIST, UK ProFound - Search known protein sequences with peptide mass information from Rockefeller and NY Universities [or fromGenomic Solutions] ProteinProspector - UCSF tools for peptide masses data (MS -Fit, MS-Pattern, MS-Digest, etc.) Base de datos con proteomas de diferentes células y organismos http://expasy.org/swiss-2dpage/viewer&map=ecoli&ac=all Proteómica funcional Una proteína puede ser identificada pero aun así no conocemos: Detalles estructurales Localización Interacción- pequeñas moléculas Interacción con otras proteínas Modificaciones postraduccionales Vida media DETECCIÓN DE INTERACCIONES PROTEÍNA-PROTEÍNA POR MICROARREGLOS Microarreglo de proteínas MAPAS DE INTERACCIÓN-BIOLOGÍA DE SISTEMAS • Convergencia entre ciencia del descubrimiento y ciencia conducida por hipótesis. • La biología de sistemas puede detectar conexiones entre muchas funciones celulares que no son aparentes ni predecibles. • Puede colectar datos más allá de nuestras habilidades, validarlos, integrarlos e interpretarlos. Trabajos del grupo de tuberculosis y paratuberculosis bovina en proteómica aplicada Identificación de glicoproteínas de M. tuberculosis Caracterización de la unión del antígeno P27 de M. bovis a receptor celular Búsqueda de antígenos candidatos en diferentes especies de bacterias Identificación de las proteínas reguladas por el represor Mce3R (un regulador transcripcional) Biomarcadores de TB bovina • La tuberculosis (TBC) es una enfermedad infectocontagiosa crónica causada por bacterias del género Mycobacterium, que afecta tanto a hombres como a animales desde tiempos remotos. • En 1882, Robert Koch descubrió el agente causal de la TBC, al encontrar un bacilo constantemente asociado con la enfermedad clínica. El agente etiológico de la Mycobacterium tuberculosis. tuberculosis en humanos es • Un tercio de la población mundial está infectada. • Entre el 5 % y el 10 % de los infectados desarrollarán la enfermedad en algún período de sus vidas. • 9 millones de personas por año contraen la enfermedad activa, mientras que otros 2 millones mueren por consecuencia de ello. (WHO, 2007) La tuberculosis bovina es causada por Mycobacterium bovis ocasionando a nivel productivo: • Disminución de hasta un 6% en la fertilidad. • Disminución de un 10% en la producción láctea. • Pérdida del 15% en promedio del peso del animal, disminuyendo la producción de carne. • Aumento de la susceptibilidad a otras enfermedades. (SENASA, 2006). 1. Mycobacterium tuberculosis glycoproteomics based on ConA-lectin affinity capture of mannosylated proteins Margarita González-Zamorano1, Guillermo Mendoza-Hernandez2, Wendy Xolalpa1,Cristina Parada1, Antonio J Vallecillo1, Fabiana Bigi3, and Clara Espitia Instituto de Investigaciones Biomédicas Nacional Autónoma de México, Departamento de Bioquímica Instituto de Investigaciones Biomédicas., Instituto de Biotecnología, CICVyA-INTA Objetivo: Identificar las glicoproteínas de Mycobacterium tuberculosis Existen dos tipos de glicosilaciones: O-glicosilación y Ngliosilación En micobacterias: O-glicosilación por residuos de manosa (o-manosilación) Las glicoproteínas juegan son importantes inmunoduladores ya que muchas de ellas une receptores Toll-like Estrategia experimental: 1. Purificar las glicoproteínas presentes en el sobrenadante de cultivo de M. tuberculosis mediante pasaje por una columna de ConA 2. Separar las proteínas por electroforésis en dos dimensiones 3. Identificar las proteínas presentes en el gel por Tandem Mass spectrometry (LC/ESI-MS/MS) 4. Confirmar la identidad de las proteínas mediante western blot con anticuerpos específicos Cromatografía de afinidad por unión a ConA Concanavalina A 1. Cargado de las muestras Proteínas pegadas específica e inespecificamente Proteínas totales libres 2. Unión de las proteínas a la matriz-ConA Unión específica de glicoproteínas Proteínas inespecíficas liberadas con los lavados 4. eluído 3. lavados glicoproteínas 1. Proteínas de SC totales 2. Proteínas eluídas de columna ConA 3. Western blot con ConA 4. WB con Con A en presencia de metil-α-Dmannopiranosido coomasie ConA ConA+ metil-α-Dmannopiranosido Se identificaron 41 proteína, 34 posibles manosil glicoproteínas Anti- Pst1 y antiLpqH Anti- LprG/P27 LprG/P27 es un importante factor de virulencia de las micobacterias patógenas ya que la eliminación de su gen produce una severa atenuación de la bacteria en el modelo de ratón Se demostró que esta proteína forma junto con otra un sistema de eflujo de compuesto Ejerce un efecto inmunomodulador en ratones cuando es administrada como proteína o como gen Conclusión: El factor de virulencia P27/LprG de las micobacterias patógenas es una manosil glicolipoproteina capaz de unir el receptor DCSING en células dendríticas Estos hallazgos pueden explicar porque esta proteína es tan relevante para la virulencia de M. tuberculosis y M. bovis UNAM (O-manosilación) University of Oxford, England (unión a DC-SING) IB-INTA 2. Identificación de antígenos proteicos en aislamientos clínicos de alta prevalencia de Mycobacterium tuberculosis Dos cepas de brotes de TB en Argentina Inducen respuesta inmune diferencial en pacientes tuberculosos Objetivo: Identificar las proteínas responsables de esa respuesta diferencial H: aquellas proteínas presentes en una cepa pero ausentes en la otra son las responsables de inducir la respuesta inmune diferencial observada IB-INTA Academia Nacional de Medicina Inst. Malbrán Proteínas pared cepa 12 3 5 4 1 2 6 Proteínas pared cepa 10 7 2 1 8 4 3 5 6 PROTEINAS DIFERENCIALES Nombre Cepa Fracción Proteína Comentario 10P 2 10 pared hypothetical protein MtubT1_15527 function unknown 10P 4 10 pared orotate phosphoribosyltransferase pyrE involved in pyrimidine biosynthesis 10P 5 10 pared iron-regulated peptidyl-prolyl-cistrans-isomerase A ppiA ppiases accelerate the folding of proteins [ 10P 7 10 pared F420-dependent glucose-6phosphate dehydrogenase catalyzes oxidation of glucose-6-phosphate to 6phosphogluconolactone using coenzyme f420 12P 6 12 pared short-chain type dehydrogenase/reductase function unknown; supposed involved in cellular metabolism 10C 6 10 citoplasma heat shock protein HtrA possibly hydrolyzes peptides and/or proteins 10SN 10 sobrenadant e pyruvate dehydrogenase subunit E1 aceE Involved in energy metabolism; contributes to acetyl-CoA production as part of pyruvate dehydrogenase complex Validación de la expresión diferencial de proteínas por qRT-PCR 1,0 0,8 0,6 0,4 0,2 Rv2241 Genes Rv1223 Rv2624 Rv1144 Rv0407 Rv0382 0,0 Rv0009 Log 2 Ratio 1,2 3. Identificación de nuevos antígenos para el diagnóstico serológico de M. paratuberculosis Estrategia experimental: 1. Extracción de proteínas de pared de M. paratuberculosis 2. Separación de las proteínas en geles de 2D 3. Transferencia de los geles a filtros de nitrocelulosa 4. Análisis por inmunoblot de los filtros con sueros negativos y positivos (de bovinos con paraTB) 5. Identificación de los spots diferenciales (positivosnegativos) 6. Aislamiento del spot correspondiente e identificación por MALDI-TOF y Mascot Electroforésis en 2D de proteínas de pared de micobacterias para la identificación de antígenos humorales. Objetivo: Extraer y Resolver por medio de electroforesis en 2D las proteínas de la pared de Mycobacterium spp. Identificar las proteínas de la pared de M. avium y M. avium subsp. paratuberculosis reconocidas por sueros provenientes de bovinos con paratuberculosis. Comparar el perfil de proteínas de pared de las dos especies, reconocidas por los sueros de los bovinos. Resultados 7 4 7 4 97 66 45 97 66 45 31 31 21 14 21 14 M. avium M. paratuberculosis 7 4 7 4 97 66 45 97 66 45 31 31 21 21 14 M. tuberculosis M. smegmatis 14 El procedimiento descrito permitió la extracción, resolución y separación de proteínas de la pared de varias especies micobacterianas, inclusive M. tuberculosis Reconocimiento de proteínas (sueros de animales con paratuberculosis) 4 4 7 97 97 66 66 45 7 45 31 31 21 21 14 14 Western blot de proteínas de pared de Mycobacterium avium. Western blot de proteínas de pared de Mycobacterium avium subsp paratuberculosis. (confirmados por ELISA y aislamiento del patógeno) Análisis comparativo de proteínas Inmunoreactivas presentes en pared micobacteriana de las especies M. avium subsp paratuberculosis y M. avium 7 4 4 7 4 97 66 97 66 45 45 31 31 21 21 14 14 M. avium subsp paratuberculosis 7 M. avium Óvalos negros: proteínas reconocidas por animales con paratuberculosis luego de adsorción y no reconocidas por negativos. Óvalos verdes: proteínas reconocidas por animales positivos y negativos. Óvalos naranja: proteínas reconocidas solo por animales positivos, no se encuentran luego de la adsorción. Rectangulos y cuadrados rosas: proteínas diferenciales reconocidas por animales positivos y / o reconocidas por animales positivos que desaparecen luego de la adsorción. * En esta diapositiva la membrana correspondiente a M. avium subsp paratuberculosis fue girada en sentido horizontal (espejo). 4. Identificación del regulón Mce3R de Mycobacterium tuberculosis INSTITUTO DE BIOTECNOLOGÍA CICVyA INTA. Las proteínas Mce del género Mycobacterium se encuentran codificadas en varios operones (cuatro en M. tuberculosis/bovis) Son importantes para la replicación del bacilo en el hospedador Se cree que constituyen sistemas de transporte, pero no se conoce aún la función Mutantes de los operones mce yrbE1B::hyg (mce1) mce2A::km (mce2) mce3A::km (mce3) (mce4) hyg km km Sobrevida de ratones incoulados por via intratraqueal 100 80 H37Rv MCE1 60 MCE2 MCE3 D1 40 20 0 2 4 6 8 10 12 14 16 18 20 Weeks post infection Trabajo realizado en colaboracion con el Dr. R Hernandez-Pando del Inst. Nac. de la Nutricion Mexico DF Posibles funciones de los operones mce Transporte y Invasión dominios de transportadores ABC ABC transporter permeases and substrate-binding proteins Arruda S, Bonfim G, Knights R, Huima-Byron T, Riley L W: Cloning of an M. tuberculosis DNA fragment associated with entry and survival inside cells. Science 1993, 261:1454-1457. Kumar A, et al.Comparison of mammalian cell entry operons of mycobacteria: in silico analysis and expression profiling. FEMS Immunol Med Microbiol 2005, 43: 185-195. Knockout de Rv1963c en M. tuberculosis Rv1963c yrbEA mceA mceC lprM Rv1972 Rv1974 mce3 Rv1973 Rv1975 Hyg Rv1963c codifica para un regulador transcripcional de la familia Tet Rv1963c (Mce3R) reprime completamente la expresión del operón mce3 de M. tuberculosis Objetivo general: descifrar la función de los genes mce de M. tuberculosis Basados en la premisa que todos los genes regulados por un mismo regulador trascripcional cumplen funciones asociadas, se buscaron todos aquellos genes cuya expresión este regulada por Mce3R con el objeto de descifrar la función del operón mce3 Se comparó el proteoma de la cepa mutante (Dmce3R) con la cepa salvaje (H37Rv) Mediante búsqueda en bases de datos se investigó en la función de los genes regulados por Mce3R Comparación de los proteomas de la pared celular de la cepa mutante Dmce3R y la salvaje H37RV MONOXIGENASA MUTANTE SALVAJE Probable metiltransferasa Probable sintetasa de riboflavina subunidad β Probable metiltransferasa Rv1498c Proteína conservada hipotética Rv2315c Probable succinato semialdehido deshidrogenasa Rv0234c (gabD1) Probable acetil-CoA acetiltransferasa FadA4 Rv1323 (fadA4) Myo-inositol-1fosfato-sintetasa Ino1 Rv0046c (ino1) WT Mut EphB WT Mut SDS-PAGE (1D), tinción con nitrato de plata Mono oxigenasa EphB Extracto Sobrenadante Se identificaron posibles miembros del regulón Mce3R Dos de las proteínas identificadas en pared y sobrenadante de cultivo de la cepa mutante (Rv1936 y EphB) también fueron detectadas como sobreexpresadas en experimentos de microarreglos Muchas de las proteínas sobreexpresadas en la cepa mutante están involucradas en el metabolismo de lípidos Conclusión: El operón mce3 podría codificar para un transportador cuyo sustratos son lípidos 5. PROTEINAS DIFERENCIALES DE Salmonella gallinarum CEPA VACUNAL-AISLAMIENTO DE CAMPO OBJ: Identificar proteínas marcadoras de los aislamientos de campo para determinar si los brotes son debidos a la cepa vacunal. 6. PROTEOMA DE CELULAS MONONUCLEARES DE SANGRE PERIFERICA DE BOVINOS 1D 2D Obj. Identificar proteínas biomarcadoras de tuberculosis bovina en sangre periférica Proteómica comparativa en muestras de animales infectados y controles sanos Conclusiones Aplicaciones de las tecnologías proteomicas a: 1. Identificación de proteínas bacterianas con expresión diferencial (Laura Klepp) 2. Identificación de proteínas con modificaciones postraduccionales (Lab C. Espitia e IB-INTA) 3. Identificación de interacciones proteína-proteína Unión a receptores celulares (María Carrol Univ of Oxford e IB-INTA) 4 y 5 Estudios inmunológicos-Inmuno proteomica para la identificación de antígenos candidatos (Gabriela Echeverria y M Romano, L. Klepp) 6. Biomarcadore de TB bovina (F. Blanco)