Capítulo 2. Bases de datos de secuencias de proteínas.

Anuncio
2
de datos de
Bases
Secuencias de proteínas
Capítulo
La Bioinformática es el área de las ciencias de la computación que permite la búsqueda
de soluciones a los problemas biológicos con herramientas computacionales. Tanto el
análisis proteómico y genómico como sus disciplinas relacionadas pueden ser abordados desde múltiples perspectivas, a partir de la enorme disponibilidad de secuencias
moleculares depositadas en las bases de datos internacionales tales como SwissProt/TrEMBL (Boeckman et al., 2003), PIR-PSD (Wu et al., 2003) y PRF.
Esta sección tiene por objeto describir las bases de datos de secuencias de proteínas
más utilizadas a nivel mundial.
UNIVERSIDAD DE CARTAGENA
Swiss-prot/TrEMBL
URL: http://www.expasy.ch/cgi-bin/sprot-search-ful
http://www.expasy.ch/cgi-bin/sprot-search-ful
Swiss-prot/TrEMBL
ENTIDADES ADMINISTRADORAS
Instituto Suizo de Bioinformática (SIB), Laboratorio de Biología Molecular Europeo, Instituto de Bioinformática de Europa (EMBL/EBI) y la Compañía Bioinformática Geneva (GeneBio).
DESCRIPCIÓN
Esta base de datos de proteínas es altamente depurada, es decir, ha sido revisada con el objeto de evitar copias de secuencias de proteínas dentro de la misma.
Contiene referencias cruzadas y sólo incluye un registro por producto proteico.
Swiss-Prot/TrEMBL está constituida por la fusión de dos bases de datos SwissProt que almacena secuencias de proteínas y TrEMBL, la cual contiene todas las
traducciones a proteína de las secuencias de nucleótidos archivadas en la base
de datos EMBL (http://www.ebi.ac.uk/embl) que aún no han sido introducidas
en Swiss-Prot. Desde 1996 a finales de 2003, Swiss-Prot almacenó un total de
140.000 entradas. Por su parte, en este mismo período del tiempo, TrEMBL
creció de 86.000 entradas en su primer lanzamiento a cerca de 1.1 millones
(Bairoch et al., 2005)
UNIVERSIDAD DE CARTAGENA
PIR-PSD (Base de Datos Internacional de
Secuencias de Proteínas)
Colaboración con el Centro de Información Munich para secuencias de proteínas (MIPS) y la Base de Datos Internacional Japonesa de Secuencias de Proteínas (JIPID).
DESCRIPCIÓN
Base de datos integrada y no redundante de secuencias de proteínas, clasificadas en superfamilias y familias, anotaciones funcionales y estructurales, con
sus respectivos datos genéticos y bibliográficos.
La base de datos contiene el nombre y clasificación de las proteínas, el nombre
del organismo donde es posible encontrar, referencias de literatura primaria y
la re-gión biológica de interés con la secuencia. PIR-PSD contenía hasta el 31
de di-ciembre del 2004, 283416 entradas.
La clasificación en familias es prioridad central en la organización y anotación
de PIR. Los procedimientos automatizados han hecho posible la ubicación demás del 99% de secuencias dentro de familias y más del 70% en superfamilias. Lo anterior ha mejorado la sensibilidad para la identificación de proteínas,
ayuda a detectar y corregir errores sistemáticos de anotaciones genómicas y
ha permitido una comprensión completa de la relación secuencia-función
(Apweiler et al., 2004).
UNIVERSIDAD DE CARTAGENA
http://pir.georgetown.edu/pirwww/dbinfo/pir_psd.shtml
ENTIDADES ADMINISTRADORAS
PIR-PSD
URL: http://pir.georgetown.edu/pirwww/dbinfo/pir_psd.
Shtml
NCBI's Entrez Protein
URL: http://www.ncbi.nlm.nih.gov/entrez/query.
Fcgi?db=Proteina
NCBI's Entrez Protein
http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Proteina
ENTIDADES ADMINISTRADORAS
Centro Nacional de Información en Biotecnología, Librería Nacional de Medicina, Instituto Nacional de Salud de Estados Unidos.
DESCRIPCIÓN
La base de datos NCBI's Entrez Protein contiene secuencias de proteínas derivadas de varias fuentes (Wheeler et al., 2005; Wheeler et al., 2006) producto de
la traducción de secuencias nucleótidas depositadas en las bases de datos
internacionales DDBJ (Japón) (Miyazaki et al., 2004; Okubo et al., 2006), EMBL
(Europa) (Kanz et al., 2005; Cochrane et al., 2006) y GenBank (USA) (Benson et
al., 2004; Benson et al., 2006). Además, posee entradas extraídas de bases de
datos curadas tales como Swiss Prot (Bairoch et al., 2004), PIR (Wu et al.,
2003), RefSeq (Pruitt et al., 2005) y Protein Data Bank (PDB) (Deshpande et al.,
2005).
La nueva generación de bases de datos de secuencias de proteínas está constituida por aquellas que permiten integrar varias Bases de Datos. Un ejemplo importante es el Recurso Universal de Proteínas UniProt (Bairoch et al., 2005; Wu
et al., 2006), el cual lo conforma un consorcio de las Bases de Datos Swiss-Prot,
TrEMBL y PIR. El incremento del volumen y variedad de secuencias de proteínas
e información suministrada por esta asociación es una herramienta angular
para la actividad científica en recursos biológicos modernos (Apweiler et al.,
2004).
UNIVERSIDAD DE CARTAGENA
UNIPROT (Recurso Universal
de Proteínas)
SIB, EBI, PIR, Centro Médico de Georgetown y la Fundación Nacional de
Recursos Biomédicos.
DESCRIPCIÓN
El consorcio UniProt mantiene tres capas de bases de datos. A) El archivo de
UniProt (UniParc) ofrece una recopilación estable y comprensiva de secuencias
no redundantes, como resultado del almacenamiento del cuerpo completo de
datos de secuencias de proteínas evaluables de manera pública. B) El conocimiento basado en UniProt (UniProt) provee la base de datos central de secuencias precisas y consistentes de proteínas y anotaciones funcionales. C)
La base de datos de referencias UniProt (UniRef) suministra datos no redundantes de las recopilaciones obtenidas de las bases datos Uniparc y UniProt
con el objeto de obtener una convergencia completa de espacios secuenciales
de diversas resoluciones (Bairoch et al., 2005; Wu et al., 2006).
Las siguientes direcciones de Internet corresponden a otras bases de datos de
secuencias de proteínas:
- RefSeq (http://www.ncbi.nih.gov/RefSeq) (Pruitt et al., 2005).
- MPSS (http://www.scbit.org/mpss/) (Hao et al., 2005).
UNIVERSIDAD DE CARTAGENA
http://www.uniprot.org
ENTIDADES ADMINISTRADORAS
UNIPROT
URL: http://www.uniprot.org
UTILIZACIÓN DE BASES DE DATOS DE PROTEÍNAS
Para tener acceso a las bases de datos de tal forma que la información disponible sea recuperada para análisis bioinformático, es necesario poseer una
secuencia de aminoácidos o el código de la(s) proteína(s) a evaluar.
UTILIZACIÓN DE BASES DE
datos de proteínas
Cada una de estas bases de datos trabaja con formatos particulares de secuencia, los más utilizados son los escritos en for-mato Fasta. Una secuencia
en formato FASTA comienza con una descripción de una línea singular, seguida
por una línea de datos de la secuencia. La descripción de la línea difiere de los
datos de la secuencia por el símbolo (">") en la primera columna. Es recomendable que todas las líneas del texto posean menos de 80 caracteres.
Ejemplo: La secuencia del precursor de la Actinidina en formato Fasta es la
siguiente:
>sp|P00785|ACTN_ACTCH Actinidain precursor (EC 3.4.22.14) (Actinidin)
(Allergen Act c 1) - Actinidia chinensis (Kiwi) (Yangtao).
MGLPKSFVSMSLLFFSTLLILSLAFNAKNLTQRTNDEVKAMYESWLIKYGKSYNSLG
EWERRFEIFKETLRFIDEHNADTNRSYKVGLNQFADLTDEEFRSTYLGFTSGSNKTK
VSNRYEPRFGQVLPSYVDWRSAGAVVDIKSQGECGGCWAFSAIATVEGINKIVTGVL
ISLSEQELIDCGRTQNTRGCNGGYITDGFQFIINNGGINTEENYPYTAQDGECNLDLQ
NEKYVTIDTYENVPYNNEWALQTAVTYQPVSVALDAAGDAFKHYSSGIFTGPCGTAID
HAVTIVGYGTEGGIDYWIVKNSWDTTWGEEGYMRILRNVGGAGTCGIATMPSYPVKY
NNQNHPKPYSSLINPPAFSMSKDGPVGVDDGQRYSA
UNIVERSIDAD DE CARTAGENA
2.1B.
Figura 2.1. Número de accesión primaria e identificador gi del precursor de la
Actinidina. A) Swiss-Prot/TrEMBL. B) Base de datos de secuencias de proteínas implementada en la entrada de proteínas del NCBI (Centro Nacional de
Biotecnología).
UNIVERSIDAD DE CARTAGENA
datos de proteínas
2.1A.
UTILIZACIÓN DE BASES DE
Por lo general, la línea de descripción comprende el número de acceso primario en las bases de datos de secuencias de proteínas (P00785), el nombre
de la entrada (ACTN-ACTCH Actinidain precursor) y los diversos nombres que
puede tomar la proteína (EC 3.4.22.14 , Actinidin, Allergen Act c 1) (Figura
2.1).
Las secuencias deben estar representadas en la nomenclatura estándar IUB/IUPAC (Unión Internacional de Química Pura y Aplicada). Los códigos aceptados son los siguientes:
UTILIZACIÓN DE BASES DE
datos de proteínas
Símbolo
Nombre
Símbolo
Nombre
A
D
T
W
I
L
Alanina
Ácido Aspártico
Treonina
Triptófano
Isoleucina
Leucina
P
S
F
G
Y
M
Prolina
Serina
Fenilalanina
Glicina
Tirosina
Metionina
Símbolo
Nombre
Q
E
V
H
K
R
_
Glutamina
Ácido Glutámico
Valina
Histidina
Lisina
Arginina
Longitud indeterminada
de gaps
Además de las bases de datos generales, existen tambien un buen número de
bases especializadas de gran importancia para focalizar proyectos y obtener
información adicional, comúnmente no accesible desde las bases generales.
Por ejemplo, existen bases de datos relacionadas con proteínas alergénicas
como FARRP, Allermath entre otros, las cuales poseen información que varía
desde secuencias, epítopes y estructuras, hasta datos de reactividad cruzada
de proteínas alergénicas. A conti-nuación aparece una descripción de bases de
datos referentes a alergenos y epítopes de células B y T.
UNIVERSIDAD DE CARTAGENA
URL: http://www.allergenonline.com/
ENTIDADE ADMINISTRADORA
Universidad de Nebraska Lincoln.
DESCRIPCIÓN
La base de datos FARRP posee una lista actualizada de alergenos conocidos.
Las fuentes de proteínas relacionadas con alergia provienen de la Academia
Americana de Alergia, Sociedad de Asma e inmunología (http://www.aaaai.org), Academia Europea de Alergología e Inmunología Clínica (http://www.eaaci.net/site/homepage.php), y la Red de Alergia a los Alimentos & Anafilaxis.
FARRP ofrece búsqueda de alergenos conocidos por medio del formato algoritmo FASTA (Hileman et al., 2002).
UNIVERSIDAD DE CARTAGENA
FARRP
http://www.allergenonline.com/
FARRP (Investigación y Recursos de
Programas en Alergia a los Alimentos)
Base de Datos Allermatchtm
URL: http://www.allermatch.org/
Allermatch
http://www.allermatch.org/
ENTIDADES ADMINISTRADORAS
RIKILT-Instituto de seguridad del alimento, Investigación Nacional de Plantas
y el Ministerio Holandes de Agricultura, Naturaleza y Valor Nutritivo.
DESCRIPCIÓN
tm
Allermatch provee tres bases de datos de secuencias conocidas de proteínas
alergénicas: Swiss-Prot/TrEMBL, la referente a la nomenclatura de alergenos
perteneciente a la Organización Mundial de la Salud y la Unión Internacional de
Sociedades Inmunológicas (WHO-IUS), esta última base de datos es una comtm
binación no redundante de las descritas con anterioridad. Allermatch provee
una herramienta accesible, eficiente y útil para el análisis del potencial de alergenicidad de proteínas perteneciente a alimentos modificados genéticamente,
siguiendo las recomendaciones de los expertos consultores de la FAO/WHO
(Fiers et al., 2004).
UNIVERSIDAD DE CARTAGENA
(Base de Datos de Epítopes Células B)
ENTIDADES ADMINISTRADORAS
Instituto de Tecnología Microbial Chandigarh, India.
DESCRIPCIÓN
La versión actual de la base de datos Bcipep contiene 3031 entradas que
incluyen 763 epítopes inmunodominantes, 1797 inmunogénicos y 471 no inmunogénicos. Bcipep cubre una amplia gama de organismos patógenos tales
como virus, bacterias, protozoos y hongos. La base de datos proporciona una
variedad de herramientas para el análisis y la extracción de datos que incluyen
búsquedas de palabras claves, mapeo de péptidos y evaluación de similaridad
por medio del algoritmo Blast. También posee hipervínculos a varias bases de
datos tales como GenBank, PDB, Swiss-Prot y MHCBN (Comprehensive Database of MHC Binding and Non-binding Peptides) (Saha et al., 2005).
Bcipep es fuente de información para investigadores implicados en diseño,
diagnóstico de enfermedades y síntesis de péptidos o vacunas para tratar la
alergia, además, suministra datos importantes para el desarrollo y la evaluación de los métodos de predicción de epítopes reconocidos por células B (Saha
et al., 2005).
UNIVERSIDAD DE CARTAGENA
Bcipep
http://bioinformatics.uams.edu/mirror/bcipep/
Bcipep
URL: http://bioinformatics.uams.edu/mirror/bcipep/
SDAP (Base de Datos Estructural de Alergenos)
URL: http://fermi.utmb.edu/SDAP/index.html
http://fermi.utmb.edu/SDAP/index.html
SDAP
ENTIDADES ADMINISTRADORAS
Universidad Médica de Texas Branch (UTMB).
DESCRIPCIÓN
SDAP es un servidor web que provee información en bases de datos y varias
herramientas computacionales para el estudio de proteínas alérgenicas. SDAP
contiene información de nombres de alergenos, fuentes, secuencias, estructuras, epítopes IgE, referencias extractadas de servidores de proteínas mayores
(PDB, Swiss-Prot, PIR, Genbank) y servidores de literatura (PudMed, Medline).
El componente computacional utilizado en SDAP consiste en un algoritmo
basado en la similitud de propiedades fisicoquímicas de los aminoácidos que
conforman los alergenos (Ivanciuc et al., 2002; Ivanciuc et al., 2003a). Esta y
otras herramientas bioinformáticas disponibles en SDAP son utilizadas para
predecir el potencial de reactividad cruzada entre proteínas alergénicas y la
identificación de sus epítopes IgE (Ivanicuc et al., 2003b; Schein et al., 2005).
UNIVERSIDAD DE CARTAGENA
2.2.
Figura 2.2. Reporte de salida de la base de datos estructural SDAP al ingresar
el código Act c 1 (Actinidia chinensis).
UNIVERSIDAD DE CARTAGENA
http://fermi.utmb.edu/SDAP/index.html
SDAP
Ejemplo: El código de la Actinidina según el Comité de Nomenclatura de Alergia
es Act c 1, el cual al ser ingresado en la base de datos SDAP, el servidor despliega información sobre el tipo de alergeno, en este caso de alimentos, nombre sistemático y común de la especie (Actinidia Chinesis, kiwi) y la clase a la
cual pertenece (Chistean proteasa). De la misma forma reporta vínculos para
acceder a referencias depositadas en PudMed (Pastorello et al., 1998), códigos
de Swiss-Prot (P00785) y GenBank (166317) utilizando la secuencia de dicho
alergeno. Si la proteína posee estructura cristalina este aparece con un vínculo
de conexión con la base de datos PDB (Protein Data Bank) (Figura 2.2).
Direcciones de Internet de otras bases de datos y herramientas
para el estudio de alergenos.
Internet
Bases de datos y herramientas de proteínas alergénicas
Base de Datos Alergenos CSL
URL: http://allergen.csl.gov.uk/ (Gendel, 1998)
Allergome: una Plataforma para el Conocimiento de Alergenos
URL: http://www.allergome.org (Mary et al., 2004).
PROTALL (Alergenos de los alimentos de
origen vegetal. La Relación entre Potenciales Alergénicos y Actividad Biológica)
URL: http://www.ifrn.bbsrc.ac.uk/protall
ALLALLERGY
URL: http://www.allallergy.net
AllerPredict
URL: http://sdmc.izr.a-star.edu.sg/Templar/
DB/Allergen/Predict/Predict.html
UNIVERSIDAD DE CARTAGENA
IUIS (Unión Internacional de Sociedades
Inmunológicas)
URL: http://www.allergen.org Nomenclature´
(Marsh et al., 1986).
UNIVERSIDAD DE CARTAGENA
bases de datos de y herramientas alergénicas
WebAllergen
URL : http://weballergen.bii.a-star.edu.sg/ (Riaz et al., 2005).
Internet
BIFS (Base de Datos de Información en Biotecnología para la
Seguridad del Alimento)
URL: http://www.iit.edu/~sgendel/fa.htm
(Stoesser et al., 2002).
R
EFERENCIAS
•Apweiler, R., Bairoch, A., Wu, C. 2004. Protein sequence databases. Curr. Opin. Chem. Biol.
8(1):76-80.
referencias referencias referencias
Referencias
referencias referencias referencias
•Bairoch, A., Boeckmann, B., Ferro, S., Gasteiger, E. 2004. Swiss-Prot Juggling between
evolution and stability. Brief Bioinform. 5(1):39-55.
•Bairoch, A., Apweiler, R., Wu, C.H., Barrer, W.C., Boeckmann, B., Ferro, S., Gasteiger, E., Huang,
H., Lopez, R., Magrane, M., Martin, M.J., Natale, D.A., O'Donovan, C., Redaschi, N., Yeh, L.S. 2005.
The Universal Protein Resource (UniProt). Nucleic Acids Res. 33(Database issue):154-159.
•Benson, D.A., Karsch-Mizrachi, I., Lipman, D.J., Ostell, J., Wheeler, D.L. 2004. GenBank: update.
Nucleic Acids Res. 32(Suplemento 1):23-26.
•Benson, D.A., Karsch-Mizrachi, I., Lipman, D.J., Ostell, J., Wheeler, D.L. 2006. GenBank. Nucleic
Acids Res. 34(Database issue):16-20.
•Boeckmann, B., Bairoch, A., Apweiler, R., Blatter, M., Estreicher, A., Gasteiger, E., Martin, M.,
Michoud, K., O 'Donovan, C., Phan, I., Pilbout, S., Schneider M. 2003. The SWISS-PROT protein
knowledgebase and its supplement TrEMBL in 2003. Nucleic Acids Res. 31(1):365-370.
•Cochrane, G., Aldebert, P., Althorpe, N., Andersson, M., Baker, W., Baldwin, A., Bates, K.,
Bhattacharyya, S., Browne, P., Van Den Broek, A., Castro, M., Duggan, K., Eberhardt, R., Faruque,
N., Gamble, J., Kanz, C., Kulikova, T., Lee, C., Leinonen, R., Lin, Q., Lombard, V., Lopez, R., McHale,
M., McWilliam, H., Mukherjee, G., Nardone, F., Pastor, MP., Sobhany, S., Stoehr, P., Tzouvara, K.,
Vaughan, R., Wu, D., Zhu, W., Apweiler, R. 2006. EMBL Nucleotide Sequence Database:
developments in 2005. Nucleic Acids Res. 34(Database issue):10-15.
•Deshpande, N., Addess, K., Bluhm, W., Merino-Ott, J., Townsend-Merino, W., Zhang, Q.,
Knezevich, C., Xie, L., Chen, L., Feng, Z., Green, R., Anderson, J., Westbrook, J., Berman, H.,
Bourne, P. 2005. The RCSB Protein Data Bank: a redesigned query system and relational
database based on the mmCIF schema. Nucleic Acids Res. 33 (Database Issue):233-237.
•Fiers, M., Kleter, G., Nijland, H., Hijnenburg, A., Nap J., Ham, R. 2004. Allermatch™, a webtool
for the prediction of potential allergenicity according to current FAO/WHO Codex alimentarius
guidelines. BMC Bioinformatics. 5:133.
UNIVERSIDAD DE CARTAGENA
•Gendel, S.M. 1998. Sequence databases for assessing the potencial allergenicity of proteins
used in transgenic foods. Adv. Food Nutr. Res. 42:63-92.
•Ivanciuc, O., Schein, C.H., Braun, W. (2002). Data mining of sequences and 3D structures of
allergenic proteins. Bioinformatics. 18(10):1358-1364.
•Ivanciuc, O., Schein, C.H., Braun, W. 2003a. SDAP: Database and computational tools for
allergenic proteins. Nucleic Acids Res. 31(1):359-362.
•Ivanciuc, O., Mathura, V., Horiuti, T., Braun, W., Goldblum, R., Schein C. 2003b. Detecting
potential IgE-Reactive sites on food proteins using a sequence and structure database, SDAPFood. J. Agric. Food Chem. 51(16):4830-4837.
•Kanz, C., Aldebert, P., Althorpe, N., Baker, W., Baldwin, A., Bates, K., Browne, P., Broek, A.,
Castro, M., Cochrane, G., Duggan, K., Eberhardt, R., Faruque, N., Gamble, J., Diez, F., Harte, N.,
Kulikova, T., Lin, Q., Lombard, V., Lopez, R., Mancuso, R., McHale, M., Nardone, F., Silventoinen,
V., Sobhany, S., Stoehr, P., Tuli, M., Tzouvara, K., Vaughan, R., Wu, D., Zhu, W., Apweiler, R. 2005.
The EMBL nucleotide sequence database. Nucleic Acids Res. 33(Database isssue):29-33.
•Mari, A., Riccioli, D. 2004. The Allergome Web Site - A Database of Allergenic Molecules. Aim,
Structure, and Data of a web-based resource. 60th Annual Meeting American Academy of
Allergy, Asthma & Immunology. San Francisco. J. Allergy Clin. Immunol. 113(2, part 2): S301.
•Marsh, D.G., Goodfriend, L., King, T.P., Lowenstein, H., Platts-Mills, T.A. 1986. Allergen
nomenclature. Bull. World Health Organ. 5:767-774.
•Miyazaki, S., Sugawara, H., Ikeo, K., Gojobori, T., Tateno, Y. 2004. DDBJ in the stream of various
biological data. Nucleic Acids Res. 32:31-34.
•Okubo, K., Sugawara, H., Gojobori, T., Tateno, Y. 2006. DDBJ in preparation for overview of
research activities behind data submissions. Nucleic Acids Res. 34(Database Issue):6-9.
UNIVERSIDAD DE CARTAGENA
referencias referencias referencias
•Hileman, R.E., Silvanovich, A., Goodman, R.E., Rice, E.A., Holleschak, G., Astwood, J.D., Hefle,
S.L. 2002. Bioinformatic methods for allergenicity assessment using a comprehensive allergen
database. Int. Arch. Allergy Immunol. 128(4):280-291.
Referencias
•Hao, P., He, W., Huang, Y., Ma, L., Xu, Y., Xi, H., Wang, C., Liu, B., Wang, J., Li, Y., Zhong, Y. 2005.
MPSS: an integrated database system for surveying a set of proteins. Bioinformatics.
21(9):2142-2143.
•Pastorello, E.A., Conti, A., Pravettoni, V., Farioli, L., Rivolta, F., Asaloni, R., Ispano, M., Incorvaia,
C., Giufrida., Ortolani, C. 1998. Identification of actinidin as the mayor allergen of kiwi fruit. J.
Allergy Clin. Immunol. 101(Database issue):531-537.
Referencias
referencias referencias referencias
•Pruitt, K., Tatusov, T., Maglott, D. 2005. NCBI Reference Sequence (RefSeq): a curated nonredundant sequence database of genomes, transcripts and proteins. Nucleic Acids Res.
33(Database issue):501-504.
•Riaz, T., Hor, H., Krishnan, A., Tang, F., Li, K. 2005. WebAllergen: a web server for predicting
allergenic proteins. Bioinformatics. 21(10):2570-2571.
•Saha, S., Bhasin M., Raghava, G. 2005. Bcipep: A database of B-cell epitopes. BMC Genomics.
6(1):79-85.
•Schein, C., Ivancius, O., Braun, W. 2005. Common physical-chemical properties correlate with
similar structure of the IgE epitopes of peanut allergens. J. Agric. Food Chem. 53(22):87528759.
•Stoesser, G., Baker, W., Van Den Broek, A., Camon, E., Garcia-Pastor, M., Kanz, C., Kulikova, T.,
Leinonen, R., Lin, Q., Lombard, V., Lopez, R., Redaschi, N., Stoehr, P., Tuli, M.A., Tzouvara, K.,
Vaughan, R. 2002. The EMBL nucleotide sequence database. Nucleic Acids Res. 30(1):21-26.
•Wheeler, D., Barrett, T., Benson, D., Bryant, S., Canese, K ., Church, D., DiCuccio, M., Edgar, Ron.,
Federhen, S., Helmberg, W., Kenton, D., Khovayko, O., David J., Lipman, D., Madden, T., Maglott,
D., Ostell, J., Pontius, J., Pruitt, K., Schuler, G., Schriml, L., Sequeira, E., Sherry, S., Sirotkin,
Karl., Starchenko, G., Suzek, T., Tatusov, R., Tatusova, T., Wagner, L., Yaschenko E. 2005.
Database resources of the National Center for Biotechnology Information. Nucleic Acids Res.
33(Database issue):39-45.
•Wheeler, D.L., Barrett, T., Benson, D.A., Bryant, S.H., Canese, K., Chetvernin, V., Church, D.M.,
DiCuccio, M., Edgar, R., Federhen, S., Geer, L.Y., Helmberg, W., Kapustin, Y., Kenton, D.L.,
Khovayko, O., Lipman, D.J., Madden, T.L., Maglott, D.R., Ostell, J., Pruitt, K.D., Schuler, G.D.,
Schriml, L.M., Sequeira, E., Sherry, S.T., Sirotkin, K., Souvorov, A., Starchenko, G., Suzek, T.O.,
Tatusov, R., Tatusova, T.A., Wagner, L., Yaschenko, E. 2006. Database resources of the National
Center for Biotechnology Information. Nucleic Acids Research. 34(Database issue):173-180.
UNIVERSIDAD DE CARTAGENA
UNIVERSIDAD DE CARTAGENA
referencias referencias referencias
•Wu, C., Rolf Apweiler, R., Bairoch, A., Natale, D., Barker, W., Boeckmann, B., Ferro, S.,
Gasteiger, E., Huang, H., Lopez, R., Magrane, M., Martin, M., Mazumder, R., O'Donovan, C.,
Redaschi, N., Suzek, B. 2006. The Universal Protein Resource (UniProt): an expanding universe
of protein information. Nucleic Acids Res. 34(Database issue):187-191.
Referencias
•Wu, C., Yeh, L., Huang, H., Arminski, L., Alvear, J., Chen, Y., Hu, Z., Kourtesis, P., Ledley, R.,
Suzek, B., Vinayaka, C., Zhang, J., Barker, W. 2003. The Protein Information Resource. Nucleic
Acids Res. 31(1):345-347.
Descargar