2 de datos de Bases Secuencias de proteínas Capítulo La Bioinformática es el área de las ciencias de la computación que permite la búsqueda de soluciones a los problemas biológicos con herramientas computacionales. Tanto el análisis proteómico y genómico como sus disciplinas relacionadas pueden ser abordados desde múltiples perspectivas, a partir de la enorme disponibilidad de secuencias moleculares depositadas en las bases de datos internacionales tales como SwissProt/TrEMBL (Boeckman et al., 2003), PIR-PSD (Wu et al., 2003) y PRF. Esta sección tiene por objeto describir las bases de datos de secuencias de proteínas más utilizadas a nivel mundial. UNIVERSIDAD DE CARTAGENA Swiss-prot/TrEMBL URL: http://www.expasy.ch/cgi-bin/sprot-search-ful http://www.expasy.ch/cgi-bin/sprot-search-ful Swiss-prot/TrEMBL ENTIDADES ADMINISTRADORAS Instituto Suizo de Bioinformática (SIB), Laboratorio de Biología Molecular Europeo, Instituto de Bioinformática de Europa (EMBL/EBI) y la Compañía Bioinformática Geneva (GeneBio). DESCRIPCIÓN Esta base de datos de proteínas es altamente depurada, es decir, ha sido revisada con el objeto de evitar copias de secuencias de proteínas dentro de la misma. Contiene referencias cruzadas y sólo incluye un registro por producto proteico. Swiss-Prot/TrEMBL está constituida por la fusión de dos bases de datos SwissProt que almacena secuencias de proteínas y TrEMBL, la cual contiene todas las traducciones a proteína de las secuencias de nucleótidos archivadas en la base de datos EMBL (http://www.ebi.ac.uk/embl) que aún no han sido introducidas en Swiss-Prot. Desde 1996 a finales de 2003, Swiss-Prot almacenó un total de 140.000 entradas. Por su parte, en este mismo período del tiempo, TrEMBL creció de 86.000 entradas en su primer lanzamiento a cerca de 1.1 millones (Bairoch et al., 2005) UNIVERSIDAD DE CARTAGENA PIR-PSD (Base de Datos Internacional de Secuencias de Proteínas) Colaboración con el Centro de Información Munich para secuencias de proteínas (MIPS) y la Base de Datos Internacional Japonesa de Secuencias de Proteínas (JIPID). DESCRIPCIÓN Base de datos integrada y no redundante de secuencias de proteínas, clasificadas en superfamilias y familias, anotaciones funcionales y estructurales, con sus respectivos datos genéticos y bibliográficos. La base de datos contiene el nombre y clasificación de las proteínas, el nombre del organismo donde es posible encontrar, referencias de literatura primaria y la re-gión biológica de interés con la secuencia. PIR-PSD contenía hasta el 31 de di-ciembre del 2004, 283416 entradas. La clasificación en familias es prioridad central en la organización y anotación de PIR. Los procedimientos automatizados han hecho posible la ubicación demás del 99% de secuencias dentro de familias y más del 70% en superfamilias. Lo anterior ha mejorado la sensibilidad para la identificación de proteínas, ayuda a detectar y corregir errores sistemáticos de anotaciones genómicas y ha permitido una comprensión completa de la relación secuencia-función (Apweiler et al., 2004). UNIVERSIDAD DE CARTAGENA http://pir.georgetown.edu/pirwww/dbinfo/pir_psd.shtml ENTIDADES ADMINISTRADORAS PIR-PSD URL: http://pir.georgetown.edu/pirwww/dbinfo/pir_psd. Shtml NCBI's Entrez Protein URL: http://www.ncbi.nlm.nih.gov/entrez/query. Fcgi?db=Proteina NCBI's Entrez Protein http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Proteina ENTIDADES ADMINISTRADORAS Centro Nacional de Información en Biotecnología, Librería Nacional de Medicina, Instituto Nacional de Salud de Estados Unidos. DESCRIPCIÓN La base de datos NCBI's Entrez Protein contiene secuencias de proteínas derivadas de varias fuentes (Wheeler et al., 2005; Wheeler et al., 2006) producto de la traducción de secuencias nucleótidas depositadas en las bases de datos internacionales DDBJ (Japón) (Miyazaki et al., 2004; Okubo et al., 2006), EMBL (Europa) (Kanz et al., 2005; Cochrane et al., 2006) y GenBank (USA) (Benson et al., 2004; Benson et al., 2006). Además, posee entradas extraídas de bases de datos curadas tales como Swiss Prot (Bairoch et al., 2004), PIR (Wu et al., 2003), RefSeq (Pruitt et al., 2005) y Protein Data Bank (PDB) (Deshpande et al., 2005). La nueva generación de bases de datos de secuencias de proteínas está constituida por aquellas que permiten integrar varias Bases de Datos. Un ejemplo importante es el Recurso Universal de Proteínas UniProt (Bairoch et al., 2005; Wu et al., 2006), el cual lo conforma un consorcio de las Bases de Datos Swiss-Prot, TrEMBL y PIR. El incremento del volumen y variedad de secuencias de proteínas e información suministrada por esta asociación es una herramienta angular para la actividad científica en recursos biológicos modernos (Apweiler et al., 2004). UNIVERSIDAD DE CARTAGENA UNIPROT (Recurso Universal de Proteínas) SIB, EBI, PIR, Centro Médico de Georgetown y la Fundación Nacional de Recursos Biomédicos. DESCRIPCIÓN El consorcio UniProt mantiene tres capas de bases de datos. A) El archivo de UniProt (UniParc) ofrece una recopilación estable y comprensiva de secuencias no redundantes, como resultado del almacenamiento del cuerpo completo de datos de secuencias de proteínas evaluables de manera pública. B) El conocimiento basado en UniProt (UniProt) provee la base de datos central de secuencias precisas y consistentes de proteínas y anotaciones funcionales. C) La base de datos de referencias UniProt (UniRef) suministra datos no redundantes de las recopilaciones obtenidas de las bases datos Uniparc y UniProt con el objeto de obtener una convergencia completa de espacios secuenciales de diversas resoluciones (Bairoch et al., 2005; Wu et al., 2006). Las siguientes direcciones de Internet corresponden a otras bases de datos de secuencias de proteínas: - RefSeq (http://www.ncbi.nih.gov/RefSeq) (Pruitt et al., 2005). - MPSS (http://www.scbit.org/mpss/) (Hao et al., 2005). UNIVERSIDAD DE CARTAGENA http://www.uniprot.org ENTIDADES ADMINISTRADORAS UNIPROT URL: http://www.uniprot.org UTILIZACIÓN DE BASES DE DATOS DE PROTEÍNAS Para tener acceso a las bases de datos de tal forma que la información disponible sea recuperada para análisis bioinformático, es necesario poseer una secuencia de aminoácidos o el código de la(s) proteína(s) a evaluar. UTILIZACIÓN DE BASES DE datos de proteínas Cada una de estas bases de datos trabaja con formatos particulares de secuencia, los más utilizados son los escritos en for-mato Fasta. Una secuencia en formato FASTA comienza con una descripción de una línea singular, seguida por una línea de datos de la secuencia. La descripción de la línea difiere de los datos de la secuencia por el símbolo (">") en la primera columna. Es recomendable que todas las líneas del texto posean menos de 80 caracteres. Ejemplo: La secuencia del precursor de la Actinidina en formato Fasta es la siguiente: >sp|P00785|ACTN_ACTCH Actinidain precursor (EC 3.4.22.14) (Actinidin) (Allergen Act c 1) - Actinidia chinensis (Kiwi) (Yangtao). MGLPKSFVSMSLLFFSTLLILSLAFNAKNLTQRTNDEVKAMYESWLIKYGKSYNSLG EWERRFEIFKETLRFIDEHNADTNRSYKVGLNQFADLTDEEFRSTYLGFTSGSNKTK VSNRYEPRFGQVLPSYVDWRSAGAVVDIKSQGECGGCWAFSAIATVEGINKIVTGVL ISLSEQELIDCGRTQNTRGCNGGYITDGFQFIINNGGINTEENYPYTAQDGECNLDLQ NEKYVTIDTYENVPYNNEWALQTAVTYQPVSVALDAAGDAFKHYSSGIFTGPCGTAID HAVTIVGYGTEGGIDYWIVKNSWDTTWGEEGYMRILRNVGGAGTCGIATMPSYPVKY NNQNHPKPYSSLINPPAFSMSKDGPVGVDDGQRYSA UNIVERSIDAD DE CARTAGENA 2.1B. Figura 2.1. Número de accesión primaria e identificador gi del precursor de la Actinidina. A) Swiss-Prot/TrEMBL. B) Base de datos de secuencias de proteínas implementada en la entrada de proteínas del NCBI (Centro Nacional de Biotecnología). UNIVERSIDAD DE CARTAGENA datos de proteínas 2.1A. UTILIZACIÓN DE BASES DE Por lo general, la línea de descripción comprende el número de acceso primario en las bases de datos de secuencias de proteínas (P00785), el nombre de la entrada (ACTN-ACTCH Actinidain precursor) y los diversos nombres que puede tomar la proteína (EC 3.4.22.14 , Actinidin, Allergen Act c 1) (Figura 2.1). Las secuencias deben estar representadas en la nomenclatura estándar IUB/IUPAC (Unión Internacional de Química Pura y Aplicada). Los códigos aceptados son los siguientes: UTILIZACIÓN DE BASES DE datos de proteínas Símbolo Nombre Símbolo Nombre A D T W I L Alanina Ácido Aspártico Treonina Triptófano Isoleucina Leucina P S F G Y M Prolina Serina Fenilalanina Glicina Tirosina Metionina Símbolo Nombre Q E V H K R _ Glutamina Ácido Glutámico Valina Histidina Lisina Arginina Longitud indeterminada de gaps Además de las bases de datos generales, existen tambien un buen número de bases especializadas de gran importancia para focalizar proyectos y obtener información adicional, comúnmente no accesible desde las bases generales. Por ejemplo, existen bases de datos relacionadas con proteínas alergénicas como FARRP, Allermath entre otros, las cuales poseen información que varía desde secuencias, epítopes y estructuras, hasta datos de reactividad cruzada de proteínas alergénicas. A conti-nuación aparece una descripción de bases de datos referentes a alergenos y epítopes de células B y T. UNIVERSIDAD DE CARTAGENA URL: http://www.allergenonline.com/ ENTIDADE ADMINISTRADORA Universidad de Nebraska Lincoln. DESCRIPCIÓN La base de datos FARRP posee una lista actualizada de alergenos conocidos. Las fuentes de proteínas relacionadas con alergia provienen de la Academia Americana de Alergia, Sociedad de Asma e inmunología (http://www.aaaai.org), Academia Europea de Alergología e Inmunología Clínica (http://www.eaaci.net/site/homepage.php), y la Red de Alergia a los Alimentos & Anafilaxis. FARRP ofrece búsqueda de alergenos conocidos por medio del formato algoritmo FASTA (Hileman et al., 2002). UNIVERSIDAD DE CARTAGENA FARRP http://www.allergenonline.com/ FARRP (Investigación y Recursos de Programas en Alergia a los Alimentos) Base de Datos Allermatchtm URL: http://www.allermatch.org/ Allermatch http://www.allermatch.org/ ENTIDADES ADMINISTRADORAS RIKILT-Instituto de seguridad del alimento, Investigación Nacional de Plantas y el Ministerio Holandes de Agricultura, Naturaleza y Valor Nutritivo. DESCRIPCIÓN tm Allermatch provee tres bases de datos de secuencias conocidas de proteínas alergénicas: Swiss-Prot/TrEMBL, la referente a la nomenclatura de alergenos perteneciente a la Organización Mundial de la Salud y la Unión Internacional de Sociedades Inmunológicas (WHO-IUS), esta última base de datos es una comtm binación no redundante de las descritas con anterioridad. Allermatch provee una herramienta accesible, eficiente y útil para el análisis del potencial de alergenicidad de proteínas perteneciente a alimentos modificados genéticamente, siguiendo las recomendaciones de los expertos consultores de la FAO/WHO (Fiers et al., 2004). UNIVERSIDAD DE CARTAGENA (Base de Datos de Epítopes Células B) ENTIDADES ADMINISTRADORAS Instituto de Tecnología Microbial Chandigarh, India. DESCRIPCIÓN La versión actual de la base de datos Bcipep contiene 3031 entradas que incluyen 763 epítopes inmunodominantes, 1797 inmunogénicos y 471 no inmunogénicos. Bcipep cubre una amplia gama de organismos patógenos tales como virus, bacterias, protozoos y hongos. La base de datos proporciona una variedad de herramientas para el análisis y la extracción de datos que incluyen búsquedas de palabras claves, mapeo de péptidos y evaluación de similaridad por medio del algoritmo Blast. También posee hipervínculos a varias bases de datos tales como GenBank, PDB, Swiss-Prot y MHCBN (Comprehensive Database of MHC Binding and Non-binding Peptides) (Saha et al., 2005). Bcipep es fuente de información para investigadores implicados en diseño, diagnóstico de enfermedades y síntesis de péptidos o vacunas para tratar la alergia, además, suministra datos importantes para el desarrollo y la evaluación de los métodos de predicción de epítopes reconocidos por células B (Saha et al., 2005). UNIVERSIDAD DE CARTAGENA Bcipep http://bioinformatics.uams.edu/mirror/bcipep/ Bcipep URL: http://bioinformatics.uams.edu/mirror/bcipep/ SDAP (Base de Datos Estructural de Alergenos) URL: http://fermi.utmb.edu/SDAP/index.html http://fermi.utmb.edu/SDAP/index.html SDAP ENTIDADES ADMINISTRADORAS Universidad Médica de Texas Branch (UTMB). DESCRIPCIÓN SDAP es un servidor web que provee información en bases de datos y varias herramientas computacionales para el estudio de proteínas alérgenicas. SDAP contiene información de nombres de alergenos, fuentes, secuencias, estructuras, epítopes IgE, referencias extractadas de servidores de proteínas mayores (PDB, Swiss-Prot, PIR, Genbank) y servidores de literatura (PudMed, Medline). El componente computacional utilizado en SDAP consiste en un algoritmo basado en la similitud de propiedades fisicoquímicas de los aminoácidos que conforman los alergenos (Ivanciuc et al., 2002; Ivanciuc et al., 2003a). Esta y otras herramientas bioinformáticas disponibles en SDAP son utilizadas para predecir el potencial de reactividad cruzada entre proteínas alergénicas y la identificación de sus epítopes IgE (Ivanicuc et al., 2003b; Schein et al., 2005). UNIVERSIDAD DE CARTAGENA 2.2. Figura 2.2. Reporte de salida de la base de datos estructural SDAP al ingresar el código Act c 1 (Actinidia chinensis). UNIVERSIDAD DE CARTAGENA http://fermi.utmb.edu/SDAP/index.html SDAP Ejemplo: El código de la Actinidina según el Comité de Nomenclatura de Alergia es Act c 1, el cual al ser ingresado en la base de datos SDAP, el servidor despliega información sobre el tipo de alergeno, en este caso de alimentos, nombre sistemático y común de la especie (Actinidia Chinesis, kiwi) y la clase a la cual pertenece (Chistean proteasa). De la misma forma reporta vínculos para acceder a referencias depositadas en PudMed (Pastorello et al., 1998), códigos de Swiss-Prot (P00785) y GenBank (166317) utilizando la secuencia de dicho alergeno. Si la proteína posee estructura cristalina este aparece con un vínculo de conexión con la base de datos PDB (Protein Data Bank) (Figura 2.2). Direcciones de Internet de otras bases de datos y herramientas para el estudio de alergenos. Internet Bases de datos y herramientas de proteínas alergénicas Base de Datos Alergenos CSL URL: http://allergen.csl.gov.uk/ (Gendel, 1998) Allergome: una Plataforma para el Conocimiento de Alergenos URL: http://www.allergome.org (Mary et al., 2004). PROTALL (Alergenos de los alimentos de origen vegetal. La Relación entre Potenciales Alergénicos y Actividad Biológica) URL: http://www.ifrn.bbsrc.ac.uk/protall ALLALLERGY URL: http://www.allallergy.net AllerPredict URL: http://sdmc.izr.a-star.edu.sg/Templar/ DB/Allergen/Predict/Predict.html UNIVERSIDAD DE CARTAGENA IUIS (Unión Internacional de Sociedades Inmunológicas) URL: http://www.allergen.org Nomenclature´ (Marsh et al., 1986). UNIVERSIDAD DE CARTAGENA bases de datos de y herramientas alergénicas WebAllergen URL : http://weballergen.bii.a-star.edu.sg/ (Riaz et al., 2005). Internet BIFS (Base de Datos de Información en Biotecnología para la Seguridad del Alimento) URL: http://www.iit.edu/~sgendel/fa.htm (Stoesser et al., 2002). R EFERENCIAS •Apweiler, R., Bairoch, A., Wu, C. 2004. Protein sequence databases. Curr. Opin. Chem. Biol. 8(1):76-80. referencias referencias referencias Referencias referencias referencias referencias •Bairoch, A., Boeckmann, B., Ferro, S., Gasteiger, E. 2004. Swiss-Prot Juggling between evolution and stability. Brief Bioinform. 5(1):39-55. •Bairoch, A., Apweiler, R., Wu, C.H., Barrer, W.C., Boeckmann, B., Ferro, S., Gasteiger, E., Huang, H., Lopez, R., Magrane, M., Martin, M.J., Natale, D.A., O'Donovan, C., Redaschi, N., Yeh, L.S. 2005. The Universal Protein Resource (UniProt). Nucleic Acids Res. 33(Database issue):154-159. •Benson, D.A., Karsch-Mizrachi, I., Lipman, D.J., Ostell, J., Wheeler, D.L. 2004. GenBank: update. Nucleic Acids Res. 32(Suplemento 1):23-26. •Benson, D.A., Karsch-Mizrachi, I., Lipman, D.J., Ostell, J., Wheeler, D.L. 2006. GenBank. Nucleic Acids Res. 34(Database issue):16-20. •Boeckmann, B., Bairoch, A., Apweiler, R., Blatter, M., Estreicher, A., Gasteiger, E., Martin, M., Michoud, K., O 'Donovan, C., Phan, I., Pilbout, S., Schneider M. 2003. The SWISS-PROT protein knowledgebase and its supplement TrEMBL in 2003. Nucleic Acids Res. 31(1):365-370. •Cochrane, G., Aldebert, P., Althorpe, N., Andersson, M., Baker, W., Baldwin, A., Bates, K., Bhattacharyya, S., Browne, P., Van Den Broek, A., Castro, M., Duggan, K., Eberhardt, R., Faruque, N., Gamble, J., Kanz, C., Kulikova, T., Lee, C., Leinonen, R., Lin, Q., Lombard, V., Lopez, R., McHale, M., McWilliam, H., Mukherjee, G., Nardone, F., Pastor, MP., Sobhany, S., Stoehr, P., Tzouvara, K., Vaughan, R., Wu, D., Zhu, W., Apweiler, R. 2006. EMBL Nucleotide Sequence Database: developments in 2005. Nucleic Acids Res. 34(Database issue):10-15. •Deshpande, N., Addess, K., Bluhm, W., Merino-Ott, J., Townsend-Merino, W., Zhang, Q., Knezevich, C., Xie, L., Chen, L., Feng, Z., Green, R., Anderson, J., Westbrook, J., Berman, H., Bourne, P. 2005. The RCSB Protein Data Bank: a redesigned query system and relational database based on the mmCIF schema. Nucleic Acids Res. 33 (Database Issue):233-237. •Fiers, M., Kleter, G., Nijland, H., Hijnenburg, A., Nap J., Ham, R. 2004. Allermatch™, a webtool for the prediction of potential allergenicity according to current FAO/WHO Codex alimentarius guidelines. BMC Bioinformatics. 5:133. UNIVERSIDAD DE CARTAGENA •Gendel, S.M. 1998. Sequence databases for assessing the potencial allergenicity of proteins used in transgenic foods. Adv. Food Nutr. Res. 42:63-92. •Ivanciuc, O., Schein, C.H., Braun, W. (2002). Data mining of sequences and 3D structures of allergenic proteins. Bioinformatics. 18(10):1358-1364. •Ivanciuc, O., Schein, C.H., Braun, W. 2003a. SDAP: Database and computational tools for allergenic proteins. Nucleic Acids Res. 31(1):359-362. •Ivanciuc, O., Mathura, V., Horiuti, T., Braun, W., Goldblum, R., Schein C. 2003b. Detecting potential IgE-Reactive sites on food proteins using a sequence and structure database, SDAPFood. J. Agric. Food Chem. 51(16):4830-4837. •Kanz, C., Aldebert, P., Althorpe, N., Baker, W., Baldwin, A., Bates, K., Browne, P., Broek, A., Castro, M., Cochrane, G., Duggan, K., Eberhardt, R., Faruque, N., Gamble, J., Diez, F., Harte, N., Kulikova, T., Lin, Q., Lombard, V., Lopez, R., Mancuso, R., McHale, M., Nardone, F., Silventoinen, V., Sobhany, S., Stoehr, P., Tuli, M., Tzouvara, K., Vaughan, R., Wu, D., Zhu, W., Apweiler, R. 2005. The EMBL nucleotide sequence database. Nucleic Acids Res. 33(Database isssue):29-33. •Mari, A., Riccioli, D. 2004. The Allergome Web Site - A Database of Allergenic Molecules. Aim, Structure, and Data of a web-based resource. 60th Annual Meeting American Academy of Allergy, Asthma & Immunology. San Francisco. J. Allergy Clin. Immunol. 113(2, part 2): S301. •Marsh, D.G., Goodfriend, L., King, T.P., Lowenstein, H., Platts-Mills, T.A. 1986. Allergen nomenclature. Bull. World Health Organ. 5:767-774. •Miyazaki, S., Sugawara, H., Ikeo, K., Gojobori, T., Tateno, Y. 2004. DDBJ in the stream of various biological data. Nucleic Acids Res. 32:31-34. •Okubo, K., Sugawara, H., Gojobori, T., Tateno, Y. 2006. DDBJ in preparation for overview of research activities behind data submissions. Nucleic Acids Res. 34(Database Issue):6-9. UNIVERSIDAD DE CARTAGENA referencias referencias referencias •Hileman, R.E., Silvanovich, A., Goodman, R.E., Rice, E.A., Holleschak, G., Astwood, J.D., Hefle, S.L. 2002. Bioinformatic methods for allergenicity assessment using a comprehensive allergen database. Int. Arch. Allergy Immunol. 128(4):280-291. Referencias •Hao, P., He, W., Huang, Y., Ma, L., Xu, Y., Xi, H., Wang, C., Liu, B., Wang, J., Li, Y., Zhong, Y. 2005. MPSS: an integrated database system for surveying a set of proteins. Bioinformatics. 21(9):2142-2143. •Pastorello, E.A., Conti, A., Pravettoni, V., Farioli, L., Rivolta, F., Asaloni, R., Ispano, M., Incorvaia, C., Giufrida., Ortolani, C. 1998. Identification of actinidin as the mayor allergen of kiwi fruit. J. Allergy Clin. Immunol. 101(Database issue):531-537. Referencias referencias referencias referencias •Pruitt, K., Tatusov, T., Maglott, D. 2005. NCBI Reference Sequence (RefSeq): a curated nonredundant sequence database of genomes, transcripts and proteins. Nucleic Acids Res. 33(Database issue):501-504. •Riaz, T., Hor, H., Krishnan, A., Tang, F., Li, K. 2005. WebAllergen: a web server for predicting allergenic proteins. Bioinformatics. 21(10):2570-2571. •Saha, S., Bhasin M., Raghava, G. 2005. Bcipep: A database of B-cell epitopes. BMC Genomics. 6(1):79-85. •Schein, C., Ivancius, O., Braun, W. 2005. Common physical-chemical properties correlate with similar structure of the IgE epitopes of peanut allergens. J. Agric. Food Chem. 53(22):87528759. •Stoesser, G., Baker, W., Van Den Broek, A., Camon, E., Garcia-Pastor, M., Kanz, C., Kulikova, T., Leinonen, R., Lin, Q., Lombard, V., Lopez, R., Redaschi, N., Stoehr, P., Tuli, M.A., Tzouvara, K., Vaughan, R. 2002. The EMBL nucleotide sequence database. Nucleic Acids Res. 30(1):21-26. •Wheeler, D., Barrett, T., Benson, D., Bryant, S., Canese, K ., Church, D., DiCuccio, M., Edgar, Ron., Federhen, S., Helmberg, W., Kenton, D., Khovayko, O., David J., Lipman, D., Madden, T., Maglott, D., Ostell, J., Pontius, J., Pruitt, K., Schuler, G., Schriml, L., Sequeira, E., Sherry, S., Sirotkin, Karl., Starchenko, G., Suzek, T., Tatusov, R., Tatusova, T., Wagner, L., Yaschenko E. 2005. Database resources of the National Center for Biotechnology Information. Nucleic Acids Res. 33(Database issue):39-45. •Wheeler, D.L., Barrett, T., Benson, D.A., Bryant, S.H., Canese, K., Chetvernin, V., Church, D.M., DiCuccio, M., Edgar, R., Federhen, S., Geer, L.Y., Helmberg, W., Kapustin, Y., Kenton, D.L., Khovayko, O., Lipman, D.J., Madden, T.L., Maglott, D.R., Ostell, J., Pruitt, K.D., Schuler, G.D., Schriml, L.M., Sequeira, E., Sherry, S.T., Sirotkin, K., Souvorov, A., Starchenko, G., Suzek, T.O., Tatusov, R., Tatusova, T.A., Wagner, L., Yaschenko, E. 2006. Database resources of the National Center for Biotechnology Information. Nucleic Acids Research. 34(Database issue):173-180. UNIVERSIDAD DE CARTAGENA UNIVERSIDAD DE CARTAGENA referencias referencias referencias •Wu, C., Rolf Apweiler, R., Bairoch, A., Natale, D., Barker, W., Boeckmann, B., Ferro, S., Gasteiger, E., Huang, H., Lopez, R., Magrane, M., Martin, M., Mazumder, R., O'Donovan, C., Redaschi, N., Suzek, B. 2006. The Universal Protein Resource (UniProt): an expanding universe of protein information. Nucleic Acids Res. 34(Database issue):187-191. Referencias •Wu, C., Yeh, L., Huang, H., Arminski, L., Alvear, J., Chen, Y., Hu, Z., Kourtesis, P., Ledley, R., Suzek, B., Vinayaka, C., Zhang, J., Barker, W. 2003. The Protein Information Resource. Nucleic Acids Res. 31(1):345-347.