6 Predicciónproteínas de la topología membrana de las de Capítulo lice Hélice Hé e Hélice Hélic Hélice Hélice Hélice Hélice Hélice Hélice Hélice Hélice Existen dos clases principales de proteínas de membrana: las que introducen hélices en la bicapa lipídica y las que forman poros constituidos por barriles beta (tipo porinas). La topología define la orientación de estas estructuras con respecto a la membrana en la célula, en las hélices puede ser definida por la orientación del primer residuo N-terminal precisada como “fuera” cuando el mismo está en la región extra-citoplasmática y como “dentro” si está en el citoplasma. Las proteínas de membrana juegan un papel importante en la célula como componentes claves en los mecanismos de señalización célula-célula iniciando las cascadas de transducción de señales (Jung et al., 2006; Yan et al., 2006; Worman et al., 2006). Por ello, la industria farmacéutica tiene un interés particular sobre las proteínas con segmentos transmembrana (TM), dado que su participación como receptores de membra-na (kaim et al., 2006), canales iónicos (Herve et al., 2005) y transportadores (Launay et al., 2006), entre otros, los convierten en blancos UNIVERSIDAD DE CARTAGENA El análisis estructural de las proteínas de membrana es complejo en virtud de las dificultades asociadas con el crecimiento de los cristales de las mismas, y su subsecuente análisis por Resonancia Magnética Nuclear (RMN). Por lo tanto, la predicción de la estructura de este tipo de proteínas presenta un interés excepcional, máxime al considerar que la mayoría de sus topologías no son conocidas. Los métodos computacionales de predicción de topología son muy valiosos ya que proveen las bases para su análisis experimental futuro. Una variedad de métodos han sido implementados a partir de propiedades locales extractadas de la secuencias de aminoácidos que con frecuencia conforman la membrana. Algunos de los más representativos emplean la energía libre de solvatación (Eisenberg y McLachlan 1986), el índice hidropático (Kyte y Doolittle 1982), mientras que otros utilizan procedimientos tales como Tmpred (http://www.ch.embnet.org/software/ TMPRED _form.html)(Hofmann et al., 1993) y DAS (http://www.sbc.su.se/~miklos/DAS/) (Czerso et al., 1997). PHDhtm (Rost et al., 1996a) y PHDpsihtm (Rost et al., 1996b) usan redes neuronales para predecir la topología de proteínas de membrana, aunque sus resultados deben ser interpretados como una aproximación local. Los servidores HMMTOP y TMHMM emplean parametrizaciones globales a través de la implementación de Modelos de Markov ocultos, los cuales determinan estadísticamente la topología más probable para la proteína completa. Los servidores TMAP (http://www.mbb.ki.se/tmap/single.html) (Pearson y Argos et al., 1996), MEMSAT (http://saier-144-37.ucsd.edu/memsat.html) (Jones et al., 1994) y Toppred2 (http://bioweb.pasteur.fr/seqanal/interfaces/toppred.html) (Von Heigne 1994; Cserzö et al., 1997), representan formas combinadas en donde los resultados a nivel local son evaluados por métodos heurísticos globales tales como la regla interna-positiva. Esta regla propone que la mayoría de las hélices transmembrana tiene una distribución característica de los aminoácidos con carga positiva (R y K) de tal forma que las regiones loops en la zona interior de la membrana tienen más cargas positivas que los loops en la zona exterior de la misma, lo anterior permite predecir la orientación de los residuos N-terminales de las hélices TM. UNIVERSIDAD DE CARTAGENA Debe quedar claro que los modelos topológicos predichos por servidores de internet deben ser usados sólo como una guía para proveer bases experimentales en la elucidación de la topología de las membranas (Tusnady et al., 2006). A continuación serán descritos algunos de estos servidores. TMHMM Server v. 2.0 URL: http://www.cbs.dtu.dk/services/TMHMM/ ENTIDAD ADMINISTRADORA Centro para el Análisis de Secuencias Biológicas (CBS), Universidad Técnica de Denmark (DTU), Dinamarca. DESCRIPCIÓN TMHMM predice las hélices transmembrana en proteínas basándose en los modelos de Markov ocultos. La predicción de hélices TM está entre el 97% y 98% (Möller et al., 2001). Ejemplo: La secuencia en formato Fasta de la Actinidina de 30 kD y el precursor de la Actinidina cuya secuencia está almacenada bajo el código p00785 en la base de datos Swiss-Prot, fueron utilizadas como secuencias de entrada al servidor TMHMM. El reporte de salida muestra la longitud de la secuencia, número de hélices TM predichas, número esperado de residuos en hélices intramembranales, número esperado de aminoácidos en hélices transmembranales en los 60 primeros residuos de la proteína y la probabilidad total de que los residuos N-terminales estén del lado citoplasmático de la membrana (Figura 6.1A). UNIVERSIDAD DE CARTAGENA 6.1A Región 1-6 Región 7-25 Región 26-254 Péptido señal 6.1B Figura 6.1. Reporte de salida del servidor TMHMM. A) Actinidina de 30 kD. B) Precursor de la Actinidina. UNIVERSIDAD DE CARTAGENA La probabilidad total dentro del cual un residuo pertenece a una hélice transmembranal (línea de color rojo) exterior (línea de color violeta) e interior (línea de color azul) de la membrana, es presentada en la Figura 6.1A. En el eje de las abcisas está representada la posición del residuo en la proteína y en el de las ordenadas aparece la probabilidad de que el mismo esté en cada uno de los casos descritos con anterioridad. El rango establecido es de 0 a 1.2 y el grosor de la línea expresa este rango. Un espesor mayor indica una alta probabilidad de que cada residuo pertenezca a uno de los tres estados. Estas líneas están ubicadas en la parte superior de la gráfica (Figura 6.1). Como era de esperarse, todos los residuos de la Actinidina de 30 kD muestran una alta probabilidad (cercana a 1) de estar en el exterior de la membrana (Figura 6.1A). Sin embargo, el precursor de esta misma proteína posee una región en el interior de la membrana (Región 1-6, probabilidad cercana a 0.6) y otro comprendido por una hélice transmembranal (Región 7-25, probabilidad aproximada a 0.8), lo cual corresponde al péptido señal (Figura 6.1B). Esta última región es presentada por líneas verticales de color rojo cuya altura indica la probabilidad de cada residuo de estar en la región transmembranal. El servidor TMHMM posee además la opción de ofrecer resultados en forma de texto, en el que son reportadas las probabilidades de cada aminoácido en la proteína de encontrarse en la región intena, intra y externa de la membrana. HMMTOP (Predicción de hélices transmembrana y topología de proteínas). URL: http://www.enzim.hu/hmmtop/ ENTIDAD ADMINISTRADORA Centro de Recursos Biológicos, Academia de Ciencias de Hungría, Instituto de Enzimología en Budapest, Hungría. UNIVERSIDAD DE CARTAGENA DESCRIPCIÓN El servidor HMMTOP predice la localización de segmentos helicoidales transmembranales y la topología de las proteínas TM. Permite al usuario someter información adicional en relación con la localización del segmento para fortalecer la predicción. Esta opción mejora la exactitud de tal modo que es utilizada como soporte en la interpretación de resultados experimentales (Tusnády et al., 1998; Tusnády y Simón, 2001). Servidor SPLIT 4.0 (Predicción de estructuras secundarias de proteínas de membrana) URL: http://split.pmfst.hr/split/4/ ENTIDAD ADMINISTRADORA Universidad de Split y Universidad de Osijek, Croacia. DESCRIPCIÓN Split 4.0 predice la localización de hélices TM en la secuencia empleando la regla interna-positiva descrita con anterioridad. La exactitud del servidor es del 99% para predecir 178 hélices TM en todas las proteínas de membrana o subunidades de estructura 3D conocidas (Juretic et al., 2002). Al igual que con otros recursos de bioinformática, en la actualidad los servidores están empleando consensos para lograr una mayor precisión en los resultados (Patargias et al., 2006). Algunos de los que predicen regiones TM en la secuencia son los siguientes: Servidor ConPred II (Método consenso de predicción para obtener modelos de topología transmembrana con alta confiabilidad). URL:http://bioinfo.si.hirosaki-u.ac.jp/~ConPred2/ ENTIDAD ADMINISTRADORA Universidad de Hirosaki, Departamento de Electrónica y Sistemas de Información en Ingeniería. Universidad Tohoku, Departamento de Desarrollo en Biología y Neurociencia. Sendai, Japón. UNIVERSIDAD DE CARTAGENA DESCRIPCIÓN ConPred II es un servidor para predicción de topologías de segmentos TM basados en una aproximación consenso que combina resultados de varios métodos propuestos (Arai et al., 2004) tales como KKD (Klein et al., 1985), TMpred, TopPred II, DAS, TMAP, MEMSAT 1.8, SOSUI (Hirokawa et al., 1998), TMHMM 2.0 y HMMTOP 2.0. Este sistema predice topologías de secuencias de proteínas TM ejecutando los dos pasos siguientes: a) Las secuencias introducidas en el servidor son primero corridas a través del programa interno ConPred_elite (Xia et al., 2004); b) las secuencias para las cuales ConPred_elite no genera la topología TM, son trasladadas al programa ConPred_all (Ikeda et al., 2002; Ikeda et al., 2003). Este sistema automático muestra modelos teóricos de topología TM y representaciones gráficas (gráficos hidropáticos y diagramas de ruedas helicales). TUPS (Un predictor de topologías de hélices de proteínas de transmembrana) URL: http://sparks.informatics.iupui.edu/Softwares-Services_files/tups.htm ENTIDAD ADMINISTRADORA Universidad Estatal de Buffalo en New York. DESCRIPCIÓN TUPS combina la predicción de THUMBUP y UMDHMMTMHP para proteínas con segmentos TM y PHOBIUS (http://phobius.cgb.ki.se/constrained.html) (Käll et al., 2004; Käll et al., 2005), para la identificación de péptidos señales (Zhou et al., 2005). THUMBUP (http://theory.med.buffalo.edu/) utiliza una escala que mide la probabilidad de encontrar residuos en el interior (Propensidad de internalización) de la proteína (Zhou et al., 2003) y emplea la regla interna-positiva (VonHeijne et al., 1994). THUMBUP ofrece una excelente predicción para proteínas TM con estructuras conocidas (Base de datos de hélices en 3D). UNIVERSIDAD DE CARTAGENA Sin embargo, es deficiente en la predicción utilizando bases de datos de proteínas helicales 1D, las cuales contienen información topológica de las proteínas TM obtenidas a partir de técnicas experimentales, tales como fusión de genes, digestión proteolítica in situ, modificación química, entre otras (Zhou et al., 2003). UMDHMMTMHP emplea una versión modificada del programa desarrollado por la universidad de Maryland (versión1.02 http://www.cfar.umd.edu/~kanungo /software/software.html) para la predicción de la topología de hélices transmembrana. El algoritmo que emplea el servidor UMDHMMTMHP difiere de la versión 1.02 en que únicamente utiliza parámetros obtenidos de bases de datos de hélices en 3D. Ejemplo: La secuencia en formato Fasta de la Actinidina fue utilizada como dato de entrada por el servidor TUPS. Los resultados obtenidos por el servidor son presentados en tres partes. La primera describe el nombre de la secuencia, número de residuos y hélices TM. Después aparece un resumen que incluye el porcentaje de segmentos hélices, transmembranales y segmentos singulares en la proteína. Por último muestra una breve descripción de la versión del programa y sus referencias Figura 6.2. Archivo de salida del servidor TUPS. La Actinidina no es una proteína de membrana por tal razón tiene una alta probabilidad de no poseer hélices transmembranales. 6.2 UNIVERSIDAD DE CARTAGENA PREDICCIÓN DE SEGMENTOS HOJAS BETA TM ConBBPRED (Predicción Consenso de Proteínas Beta-barril Transmembranales) URL: http://bioinformatics.biol.uoa.gr/ConBBPRED ENTIDAD ADMINISTRADORA Departamento de Biología Celular y Biofísica, Facultad de Biología, Universidad de Atenas, Grecia. DESCRIPCIÓN ConBBPRED optimiza la predicción de topologías de dominios de proteínas transmembranales tipo beta-barril con algoritmos de programación dinámica. La predicción de métodos consenso mejora la significancia de cada predictor evaluable de manera individual (Bagos et al., 2005). TMBETA-NET (Discriminación y predicción de hojas beta transmembrana en proteínas externas de membrana a partir de la secuencia). URL: http://psfs.cbrc.jp/tmbeta-net/ ENTIDAD ADMINISTRADORA Centro de Recursos en Biología Computacional, AIST. Instituto de Tecnología Kyushu de Japón. DESCRIPCIÓN La composición de aminoácidos de proteínas globulares y externas de membrana han sido sistemáticamente analizados y métodos estadísticos han sido propuestos para discriminar residuos de proteínas externas de membrana. UNIVERSIDAD DE CARTAGENA . Este programa toma la secuencia de aminoácidos y muestra el tipo de proteína junto con los segmentos correspondientes a hojas beta que atraviesan la membrana. Las proteínas externas de membrana son predichas con una precisión de 89% y sus segmentos hojas beta TM con el 73%, a partir de la información de la secuencia de aminoácidos (Gromiha, et al., 2005a; Gromiha, et al., 2005b). Recientemente han sido desarrollados los algoritmos de Viterbi, los cuales utilizan programación dinámica para encontrar la secuencia más probable de estados ocultos (conocidos como trayectoria de Viterbi (TV)) que resultan de una secuencia de eventos observados, especialmente en el contexto de los Modelos Ocultos de Markov. Estos algoritmos forman un subconjunto de la teoría de la información. Los algoritmos TV han resultado en la preedición de topologías de proteínas de membrana de tipo β-barril (Fariselli et al., 2005). MINNOU (Identificación de proteínas de membranas com uso explicito de perfiles hidropáticos y alinamientos) URL: http://minnou.cchmc.org/ ENTIDAD ADMINISTRADORA Grupo de Recursos de Jarek Meller´s, Fundación de Investigación del Hospital de los Niños (CHRF) y Universidad de Cincinnati, Ohio, Estados Unidos. DESCRIPCIÓN MINNOU propone un nuevo método para predecir α-hélices y hojas β transmembranales. La aproximación es basada en la representación compacta de aminoácidos y su ambiente químico, lo cual consiste en predecir la accesibilidad al solvente y la estructura secundaria de cada aminoácido. Además utilizan explícitamente perfiles evolutivos extraídos de alineamientos múltiples (Cao et al., 2006). Recursos de proteínas de membrana URL: http://gila.bioengr.uic.edu/lab/ UNIVERSIDAD DE CARTAGENA ENTIDAD ADMINISTRADORA Laboratorio de bioingenieria de sistemas computacionales y moleculares (MoSCoBL). Universidad de Illonois, Chicago, USA. DESCRIPCIÓN Este recurso contiene 5 servidores que analizan regiones TM en proteínas y sugieren los sitios de interacción con fosfolípidos. Lo anterior es importante para dilucidar el montaje de las hélices TM y para estudiar el plegamiento de las proteínas de membrana. El servidor TMLIP (Hélice-lípido transmembrana) emplea escalas que se apoyan en análisis estadístico de información extraída de proteínas de membranas (polytopic) resueltas por rayos X de alta resolución. Existen dos escalas separadas: TMLIP-H es utilizada para las regiones de proteínas de membrana que principalmente interaccionan con cabezas de grupo de fosfolipidos y TMLIP-C para las región hidrocarbonada de la bicapa fosfolipidica (Adamian et al., 2005). También contiene el servidor LIPS (Predicción de la superficie de hélices TM-lípido) (http:// gila.bioengr.uic.edu/lab/larisa/lips.html) que predice la interfase lípido-hélices TM a partir de información de la secuencia con una precisión cercana al 90%. El servidor RANTS (Rankig de hélices transmembrana por accesibilidad al solvente) emplea un método para la predicción de hélices TM internas a partir de información extraída de la secuencia (Adamian et al., 2006). Al igual se encuentran los servidores MHIP (Potenciales interhelicales de parejas de residuos de aminoácidos en regiones TM) y el servidor MHIT (Triplete interhelical firmemente empaquetado de residuos de aminoácido en la región TM) lo cual proporciona una librerías de tripletes presentes UNIVERSIDAD DE CARTAGENA REFERENCAS •Arai, M., Mitsuke, H., Ikeda, M., Xia, J.X., Kikuchi, T., Satake, M., Shimizu, T. (2004). ConPred II: a consensus prediction method for obtaining transmembrane topology models with high reliability. 32. Nucleic Acids Res. (Web Server issue):390-393. •Adamian, L., Jackups, R. J., Binkowski, A., Liang, J. (2003). Higher-order interhelical spatial interactions in membrane proteins. J. Mol. Biol. 327(1):251-272. •Adamian, L., Liang, J. (2006). Prediction of buried helices in multispan alpha helical membrane proteins. Proteins. 63(1):1-5. •Adamian, L., Nanda, V., DeGrado, F., Liang, J. (2005). Empirical lipid propensities of amino acid residues in multispan alpha helical membrane proteins. Proteins. 59(3):496-509. •Bagos, P.G., Liakopoulos, T.D., Hamodrakas, S.J. (2005). Evaluation of methods for predicting the topology of beta-barrel outer membrane proteins and aconsensus prediction method. BMC Bioinformatics. 6(1):7. •Basta-Kaim, A., Budziszewska, B., Jaworska-Feil, L., Leskiewicz, M., Tetich, M., Otczyk, M., Kubera, M., Lason, W. (2006). Effects of neurosteroids on glucocorticoid receptor-mediated gene transcription in LMCAT cells-A possible interaction with psychotropic drugs. Eur Neuropsychopharmacol. Mar 6. [Epub ahead of print] •Cao, B., Porollo, A., Adamczak, R., Jarrell, M., Meller, J. (2006). Enhanced recognition of protein transmembrane domains with prediction-based structural profiles. Bioinformatics. 22(3):303-309. •Cserzö, M., Wallin, E., Simon, I., Heijne, G., Elofsson, A. (1997). Prediction of transmembrane alphahelices in procariotic membrane proteins: the dense alignment surface method. Prot. Eng. 10(6):673676. •Eisenberg, D., McLachlan, A.D. (1986). Solvation energy in protein folding and binding. Nature. 319(6050):199-203. •Gromiha, M.M., Ahmad, S., Suwa, M. (2005a). TMBETA-NET: Discrimination and prediction of membrane spanning β-strands in outer membrane proteins. Nucleic Acids Res. 33(Web Server issue):164167. •Gromiha, M., Suwa, M. (2005b). Predicting the topology of beta-barrel outer membrane proteins. Bioinformatics. 21(7):961-968. UNIVERSIDAD DE CARTAGENA •Fariselli, P., Martelli, P.L., Casadio, R. (2005b). A new decoding algorithm for hidden Markov models improves the prediction of the topology of all-beta membrane proteins. BMC Bioinformatics. 6(Suppl 4):S12 •Hofmann, K., Stoffel, W. (1993). TMBASE-A database of membrane spanning protein segments. Biol. Chem. Hoppe-Seyler. 374(47):166. •Jones, D.T., Taylor, W.R., Thornton, J.M. (1994). A model recognition approach to the prediction of allhelical membrane protein structure and topology. Biochemistry. 33(10):3038-3049. •Jung K., Morimoto, R., Otsuka, M., Omote, H. (2006). Transmembrane topology of vesicular glutamate transporter 2. Biol Pharm Bull. 29(3):547-549. •Juretic, D., Zoranic, L., Zucic, D. (2002). Basic charge clusters and predictions of membrane protein topology. J. Chem. Inf. Comput. Sci. 42(3):620-632. •Herve, C., Sarrouilhe, D. (2005).Connexin-made channels as pharmacological targets. Curr Pharm Des. 11(15):1941-1958. •Hirokawa, T., Boon-Chieng, S., Mitaku, S. (1998). SOSUI: classification and secondary structure prediction system for membrane proteins. Bioinformatics. 14(4):378-379. •Käll, L., Krogh, A., Sonnhammer, L. (2004). A combined transmembrane topology and signal peptide prediction method. J. Mol. Biol. 338(5):1027-1036. •Käll, L., Krogh, A., Sonnhammer, L. (2005). An HMM posterior decoder for sequence feature prediction that includes homology information. Bioinformatics. 21(Suppl 1):251-257. •Klein, P., Kanehisa, M., DeLisi, C. (1984). Prediction of protein function from sequence properties: Discriminant analysis of a database. Biochim. Biophys Acta. 787:221-226. •Klein, P., Kanehisa, M., DeLisi, C. (1985). The detection and classification of membrane-spanning proteins. Biochim. Biophys. Acta. 815(3):468-476. •Kyte, J., Doolittle, R.F. (1982). A simple method for displaying the hydropathic character of protein. J. Mol. Biol. 157(1):105-132. •Ikeda, M., Arai, M., Lao, D.M., Shimizu, T. (2002). Transmembrane topology prediction methods: a reassessment and improvement by a consensus method using a dataset of experimentally-characterized transmembrane topologies. In Silico Biol. 2(1):19-33. UNIVERSIDAD DE CARTAGENA •Ikeda, M., Arai, M., Okuno, T., Shimizu, T. (2003). TMPDB: a database of experimentally-characterized transmembrane topologies. Nucleic Acids Res. 31(1):406-409. •Launay-Vacher, V., Izzedine, H., Karie, S., Hulot, S., Baumelou, A., Deray, G. (2006). Renal Tubular Drug Transporters. Nephron Physiol. 22:103(3):97-106 •Möller, S., Croning, R., Apweiler, R. (2001). Evaluation of methods for the prediction of membrane spanning regions. Bioinformatics. 17(1): 646-653. •Patargias, G., Zitzmann, N., Dwek, R., Fischer, W. (2006). Protein-Protein Interactions: Modeling the Hepatitis C Virus Ion Channel p7. J. Med. Chem. 48:648-655. •Persson, B., Argos, P. (1996). Topology prediction of membrane proteins. Protein Sci. 5(2): 363-371. •Rost, B., Fariselli, P., Casadio, R. (1996a). Topology prediction for helical transmembrane proteins at 86% accuracy. Protein Sci. 5(8):1704-1708. •Tusnady, E., Sarkadi, B., Simon, I., Varadi, A. (2006). Membrane topology of human ABC proteins. FEBS Lett. 580(4):1017-1722. •Tusnady, E., Simon, I. (1998). Principles governing amino acid composition of integral membrane proteins: Application to topology prediction. J. Mol. Biol. 283(2):489-506. •Tusnady, E., Simon, I. (2001). The HMMTOP transmembrane topology prediction server. Bioinformatics. 17(9):849-850. •Tusnady, E., Sarkadi, B., Simon, I., Varadi, A. (2006). Membrane topology of human ABC proteins. FEBS Lett. 580(4):1017-22. •Von Heijne, G. (1992). Membrane protein structure prediction. J. Mol. Biol. 225(2): 487-494. •Von Heijne, G. (1994). Membrane proteins: From sequence to structure. Annu. Rev. Biophys. Biomol. Struct. 23:167-192. •Worman, J. (2006). Inner nuclear membrane and regulation of Smad-mediated signaling. Biochim Biophys Acta. [Epub ahead of print]. •Xia, J.-X., Ikeda, M., Shimizu, T. (2004). ConPred_elite: a highly reliable approach to transmembrane topology prediction. Comput. Biol. Chem. 28(1). 51-60. UNIVERSIDAD DE CARTAGENA •Yan, X., Yang, W., Zhang, R., Chen, L., Tang, L., Zhai, B., Liu, Q., Cao, F., Man, B., Wu, P., Wu, C., Wang, Y. (2006). Protein tyrosine phosphatase PCP-2 inhibits beta -catenin signaling and increases E-cadherindependent cell adhesion. J. Biol. Chem. [Epub ahead of print]. •Zhou, H., Zhang, C., Liu, S., Zhou, Y. (2005). Web-based toolkits for topology prediction of transmembrane helical proteins, fold recognition, structure and binding scoring, folding-kinetics analysis and comparative analysis of domain combinations. Nucleic Acids Res. 33(Web Server issue):193-197. •Zhou, H., Zhou, Y. (2003). Predicting the topology of transmembrane helical proteins using mean burial propensity and a hidden-Markov-model-based method. Protein Sci. 12(7):1547-55. UNIVERSIDAD DE CARTAGENA