k OFICINA ESPAÑOLA DE PATENTES Y MARCAS 19 k kInt. Cl. : C12N 15/38 11 Número de publicación: 2 110 999 6 51 ESPAÑA C07K 14/055 C12N 7/04 A61K 39/255 C12N 15/86 C12Q 1/70 k TRADUCCION DE PATENTE EUROPEA 12 kNúmero de solicitud europea: 91915865.9 kFecha de presentación : 19.08.91 kNúmero de publicación de la solicitud: 0 502 146 kFecha de publicación de la solicitud: 09.09.92 T3 86 86 87 87 k 54 Tı́tulo: Segmento del ADN del Herpesvirus de la Enfermedad de Marek que codifica la glicoproteı́na gE. k 30 Prioridad: 24.08.90 US 572711 25.07.91 US 736335 238 Administration Building East Lansing, Michigan 48824, US k 72 Inventor/es: Velicer, Leland F.; k 74 Agente: Ungrı́a López, Javier 45 Fecha de la publicación de la mención BOPI: 01.03.98 ES 2 110 999 T3 k 73 Titular/es: Michigan State University 45 Fecha de la publicación del folleto de patente: 01.03.98 Aviso: k Brunovskis, Peter y Coussens, Paul M. k En el plazo de nueve meses a contar desde la fecha de publicación en el Boletı́n europeo de patentes, de la mención de concesión de la patente europea, cualquier persona podrá oponerse ante la Oficina Europea de Patentes a la patente concedida. La oposición deberá formularse por escrito y estar motivada; sólo se considerará como formulada una vez que se haya realizado el pago de la tasa de oposición (art◦ 99.1 del Convenio sobre concesión de Patentes Europeas). Venta de fascı́culos: Oficina Española de Patentes y Marcas. C/Panamá, 1 – 28036 Madrid ES 2 110 999 T3 DESCRIPCION Antecedentes de la invención 5 10 15 (1) Campo de la invención La presente invención se refiere a segmentos del genoma del Herpesvirus de la Enfermedad de Marek, de su región corta única (US ) que codifica la glicoproteı́na gE y a nuevas glicoproteı́nas producidas a partir de ellos. En particular, la presente invención se refiere a segmentos de ADN que contienen los genes que codifican estos antı́genos glicoproteicos y que contienen secuencias promotoras potenciales hasta 400 nucleótidos 5’ de cada gen, segmentos que son útiles para sondar el herpesvirus de la enfermedad de Marek, como una fuente posible de promotores del virus de la enfermedad de Marek (MDV), para la expresión génica con el fin de producir las glicoproteı́nas que a su vez pueden ser utilizadas para producir anticuerpos que reconozcan los tres antı́genos glicoproteicos, y en el caso de los últimos dos genes, para sitios de inserción potenciales para genes foráneos y como sitios posibles para la inactivación génica con el fin de atenuar aislados de campo de MDV para fines de vacunación. (2) Técnica anterior 20 25 30 35 40 45 50 55 60 El MDV es un herpesvirus oncogénico de los pollos, que se sabe que causa linfomas de células T y desmielinación de los nervios periféricos. La enfermedad resultante, enfermedad de Marek (MD), fue el primer trastorno linfomatoso que acontece de forma natural que fue controlado eficazmente mediante vacunación, utilizando bien el herpesvirus de pavos (HVT) relacionado antigénicamente, además de apatogénico, o bien aislados de campo del MDV atenuados. Debido a las propiedades biológicas similares, especialmente a su linfotropismo, el MDV ha sido clasificado como un miembro de la subfamilia de los herpesvirus gamma (Roizman, B., y col., Intervirology 16:201-217 (1981)). De las tres subfamilias de los herpesvirus, los herpesvirus gamma exhiben diferencias particularmente acusadas con respecto a la composición y organización del genoma. Por ejemplo, el virus B-linfotrópico de Epstein-Barr (EBV) de los humanos tiene un genoma de 172,3 kpb con un contenido de G+C del 60%, está unido por repeticiones directas de 0,5 kpb terminales y contiene un conjunto caracterı́stico de repeticiones internas en tándem de 3,07 kpb (Baer, R., y col., Nature (London) 310:207-211 (1984)). El herpesvirus saimiri (HVS), un herpesvirus T-linfotrópico de los monos del nuevo mundo y de los vertebrados inferiores, tiene una secuencia codificadora rica en A+T (112 kpb; 36% de G+C; esto es ADN-L) sin ninguna redundancia interna a gran escala, pero en lugar de ello contiene más de 30 reiteraciones de una secuencia de 1,44 kpb con un 71% de G+C en los extremos del genoma (ADN-H) (Banker, A.T., y col., J. Virol. 55:133-139 (1985)). A pesar de las diferencias estructurales entre EBV y HVS, los genomas de estos dos virus codifican proteı́nas serológicamente relacionadas y comparten una organización común de secuencias codificadoras que difiere de la de los herpesvirus alfa neutrópicos, ejemplificados por el virus del herpes simple (HSV) y por el virus de la varicela-zóster (VZV) (Camerion, K.R., y col., J. Virol. 61:2063-2070 (1987); Davison, A.J., y col., J. Gen. Virol. 68:1067-1079 (1987); Davison, A.J., y col., J. Gen. Virol. 67:597-611 (1986); Davison, A.J., y col., J. Gen. Virol. 76:1759-1816 (1986); Davison, A.J., y col., J. Gen. Virol. 64:1927-1942 (1983); Gompels, U.A., J. of Virol. 62:757-767 (1988); y Nichols, J., y col., J. of Virol. 62:3250-3257 (1988)). En contraste con otros herpesvirus gamma, el MDV tiene una estructura genómica que se asemeja estrechamente a la de los herpesvirus alfa (Cebrian, J., y col., Proc. Natl. Acad. Sci. USA 79:555-558 (1982); y Fukuchi, K., y col., J. Virol. 51:102-109 (1984)). Los miembros de esta última subfamilia tienen estructuras genómicas similares que constan de segmentos largos (L) y cortos (S) unidos covalentemente. Cada segmento contiene un único (U) segmento (UL , US ) flanqueado por un par (terminales e interna) de regiones repetidas invertidas (TRL , IRL ; TRS ; respectivamente). Los herpesvirus alfa incluyen los HSV y VZV humanos, el virus de la pseudorrabia porcina (PRV), el herpesvirus bovino (BHV) y el herpesvirus equino (EHV). Debido a que el MDV contiene extensas secuencias repetidas que flanquean su región UL su estructura genómica se asemeja mucho a la del HSV (Cebrian, J., y col., Proc. Natl. Acad. Sci. USA 79:555-558 (1982); y Fukuchi, K., y col., J. Virol. 51:102-109 (1984)). Estudios recientes (Buckmaster, A.E., y col., J. Gen. Virol. 69:2033-2042 (1988)) han mostrado que los dos herpesvirus gamma, MDV y HVT, parecen tener una similitud mayor con los herpesvirus alfa, VZV y HSV, que con el herpesvirus gamma, EBV. Esto se basaba en una comparación de numerosos clones de MDV y HVT aislados aleatoriamente a nivel de los aminoácidos pronosticados; las secuencias individuales no sólo mostraban una mayor afinidad con los genes de los herpesvirus alfa que con los genes de los herpesvirus gamma, sino que se encontró que los dos genomas vı́ricos eran generalmente colineales con VZV, al menos con respecto a la región larga única (UL ). Tal colinealidad de los genes 2 ES 2 110 999 T3 5 10 15 20 25 30 35 40 45 50 55 60 de UL se extiende a otros herpesvirus alfa tales como HSV-1, HSV-2, EHV-1 y PRV según se evidenció por el análisis de las secuencias (McGeoch, D.J., y col., J. Gen. Virol. 69:1531-1574 (1988)) y por los experimentos de hibridación de ADN (Davison, A.J., y col., J. Gen. Virol. 64:1927-1942 (1983)). Muchos de estos genes de UL son compartidos por otros herpesvirus, incluyendo los herpesvirus beta y gamma (Davison, A.J., y col., J. Gen. Virol. 68:1067-1079 (1987)). La organización y comparación de tales genes ha sugerido el acontecimiento pasado de reordenaciones a gran escala para explicar la divergencia de los herpesvirus a partir de un antepasado común. Desgraciadamente, tal hipótesis no explica la presencia de los genes del componente S de los herpesvirus alfa (corto único, US , y corto con repeticiones asociadas invertidas/terminales, IRS , TRS ) que parecen únicos de los miembros de esta subfamilia (Davison, A.J., y col., J. Gen. Virol. 68:1067-1079 (1987); Davison, A.J., y col., J. Gen. Virol. 67:597-611 (1986); y McGeoch, D.J., y col., J. Mol. Biol. 181:1-13 (1985)). La secuencia de ADN y la organización de los genes en un fragmento de EcoR1 de 5,5 kpb que mapea en la región US de la cepa RBIB de MDV fue descrita por Ross, Binns y Pastorek (Ross, L.J.N., y col., Journal of General Virology 72:949-954 (1991)). Las propiedades y las relaciones evolutivas de cuatro de los polipéptidos pronosticados fueron también descritas (Ross, L.J.N. y M.M. Binns, Journal of General Virology 72:939-947 (1991)). En ese fragmento encontraron los homólogos de US2, US3, US6 (gD) y US7 (gI) del HSV, ası́ como un gen especı́fico del MDV. Para este último, sólo estaba presente parte del gen. Estos informes confirman la presencia de cuatro genes en US del MDV, y la relación evolutiva propuesta anteriormente. Es importante destacar que no se describió ninguna evidencia para US8 (gE), ni para los genes a la izquierda de US2. La región US de los herpesvirus alfa además de su unicidad comparada con los herpesvirus beta y gamma, es particularmente interesante debido a las notables diferencias en su contenido y organización genética dentro de esta última subfamilia (por ejemplo US de HSV-1=13,0 kpb, 12 genes, McGeoch, D.J., y col., J. Mol. Biol. 181:1-13 (1985); US de VZV=5,2 kpb, 4 genes, Davison, A.J., y col., J. Gen. Virol. 76:1759-1816 (1986)). En el caso de HSV-1, se ha encontrado que 11 de los 12 genes de US son prescindibles para la replicación en cultivo celular (Longnecker, R., y col., Proc. Natl. Acad. Sci. USA 84:4303-4307 (1987)). Esto ha sugerido la implicación potencial de estos genes en la patogénesis y/o en la latencia (Longnecker, R., y col., Proc. Natl. Acad. Sci. USA 84:4303-4307 (1987); Meignier, B., y col., Virology 162:251-254 (1988); y Weber, P.C., y col., Science 236:576-579 (1987)). En el informe de Buckmaster y col. (Buckmaster, A.E., y col., J. Gen. Virol. 69:2033-2042 (1988)), con la excepción de la identificación de secuencias parciales de MDV homólogas a la proteı́na alfa 22 (US1) temprana inmediata de HSV y la proteı́na quinasa de serina-treonina (US3), no se determinó el contenido, localización y organización de los homólogos del componente S del MDV. Además, a pesar de la presencia de al menos cuatro genes de glicoproteı́nas de US del HSV (dos en VZV), tales homólogos no fueron identificados. En la solicitud N◦ de Serie 07/229.011 registrada el 5 de Agosto de 1988, incluyendo a Leland F. Velicer, uno de los presentes inventores, el segmento de ADN del herpesvirus de la Enfermedad de Marek conteniendo posiblemente el gen que codifica el complejo antigénico B glicoproteico (gp100, gp60, gp49) fue identificado pero no secuenciado. El antı́geno B es un complejo glicoproteico importante porque puede producir al menos una inmunidad protectora parcial, y de este modo el segmento de ADN del MDV puede ser utilizado para sondas, como una fuente posible de promotores en la región reguladora 5’ del gen, y para la expresión génica con el fin de producir las glicoproteı́nas, que a su vez pueden ser utilizadas para producir anticuerpos que reconozcan los antı́genos glicoproteicos. Sin embargo, no habı́a discusión de las glicoproteı́nas de la presente invención. Estas glicoproteı́nas del antı́geno B no están codificadas por la región US y por tanto son de una región diferente del genoma del MDV. En la solicitud N◦ de Serie 07/526.790, registrada el 17 de Mayo de 1987 por Leland F. Velicer, el segmento de ADN del herpesvirus MDV conteniendo el gen que codifica el antı́geno A glicoproteico (gp57-65) está descrito pero no secuenciado. Este segmento de ADN del MDV es útil como sonda, como una fuente posible de promotores en la región reguladora 5’ del gen, y para producir anticuerpos por la secuencia de acontecimientos descrita anteriormente. Este ADN es también importante porque se sabe actualmente que el antı́geno A es un homólogo de gC del HSV, un gen no esencial para la replicación en cultivo celular. Debido a que esa propiedad se aplica también muy probablemente al homólogo del MDV, puede ser útil como un sitio para la inserción de genes foráneos. Sin embargo, no habı́a discusión de las glicoproteı́nas de la presente invención. Esta glicoproteı́na tampoco está codificada por la región US y es por tanto de una región diferente del genoma del MDV. Otras glicoproteı́nas están codificadas por el genoma del herpesvirus de la enfermedad de Marek. En la solicitud N◦ de serie 07/572.711, registrada el 24 de Agosto de 1990 por Leland F. Velicer y col., se describe el ADN del MDV que contiene los genes que codifican las glicoproteı́nas gD, gI y parte de gE 3 ES 2 110 999 T3 5 del MDV, con las secuencias de nucleótidos del MDV para los genes de gD y gI completos y para parte del gE (homólogos del MDV de los genes del HSV US6, US7, US8, respectivamente). Este segmento de ADN del MDV es útil como sonda, como una fuente posible de promotores en la región reguladora 5’ del gen, y para producir anticuerpos por la secuencia de acontecimientos descrita anteriormente. La presente invención está dirigida en particular al gen completo (US8) que codifica la glicoproteı́na gE. Objetos 10 15 Es un objeto de la presente invención proporcionar ADN secuenciado que codifica la glicoproteı́na gE. Es además un objeto de la presente invención proporcionar segmentos de ADN que codifican este antı́geno glicoproteico y que contienen secuencias promotoras potenciales hasta 400 nucleótidos 5’ del gen; los cuales son útiles como sondas de ADN, como una fuente posible de promotores del MDV, para producir anticuerpos que reconozcan el antı́geno y como sitios de inserción para genes foráneos y como sitios posibles para la inactivación génica con el fin de atenuar aislados de campo de MDV para fines de vacunación. Estos y otros objetos serán cada vez más aparentes por referencia a la descripción siguiente y a las figuras. En las figuras 20 Las Figuras 1A a C muestran la localización en el mapa, la estrategia de secuenciación y la organización de los marcos de lectura abierta (ORFs) del MDV: La Figura 1A incluye la estructura genómica del MDV y los mapas de restricción que describen el área secuenciada. 25 30 35 40 45 50 La Figura 1B incluye la localización en el mapa y la estrategia de secuenciación. Los recuadros definen los clones plasmı́dicos con insertos unidos a BamHI, EcoRI o SalI que fueron utilizados para generar los moldes de M13mp18 y 19 para la secuenciación del ADN. Las flechas hacia la derecha y hacia la izquierda definen secuencias derivadas de la hebra superior e inferior, respectivamente. Los sitios de los enzimas de restricción están identificados como: B = BamHI, E = EcoRI, Nc = NcoI, Ns = NsiI, S = SalI y P = PstI. Las secuencias derivadas de bibliotecas aleatorias (Sau3A, TaqI, RsaI), los fragmentos de restricción clonados especı́ficos, las bibliotecas digeridas con Bal 31 o utilizando oligonucleótidos derivados sintéticamente están indicados por a, b, c y d, respectivamente. La Figura 1C incluye la organización de los ORFs de US de MDV. Los números se refieren a homólogos sobre la base de la relación con la nomenclatura de los ORFs de US del HSV-1 (McGeoch, D.J., y col., J. Mol. Biol. 181:1-13 (1985)). Los recuadros representan la situación de los ORFs del MDV. Las flechas definen la dirección de la transcripción/traducción. Los nombres de los ORFs se muestran sobre los recuadros. Las señales de poliadenilación potencial en las hebras superior e inferior están resaltadas por AATAAA y AAATAA, respectivamente. SORF1 y SORF2 son ORFs del componente S especı́fico del MDV dados nombres arbitrarios. La Figura 2 muestra la secuencia de nucleótidos y de aminoácidos pronosticada. La secuencia de nucleótidos se da como la hebra 5’ a 3’ hacia la derecha solamente (numerada de 1 a 10350). Las secuencias de aminoácidos pronosticadas dirigidas hacia la derecha y hacia la izquierda se muestran por encima y por debajo de las secuencias de nucleótidos correspondientes en el código de una sola letra, respectivamente. El nombre de cada ORF se da a la izquierda de la primera lı́nea de la secuencia de aminoácidos. Las secuencias de aminoácidos están numeradas desde la primera M (código de tres letras) (ATG en el ADN) en el extremo N hasta el último aminoácido en el extremo C, que precede al codon de terminación (identificado por un ∗). Los sitios potenciales de consenso TATA situados dentro de los 400 nucleótidos del ATG están subrayados y definidos como sitios que contienen al menos seis de siete similitudes con las secuencias consenso TATA(AT)A(AT) definidas por Corden y col. (Corden, B., y col., Science 209:1406-1414 (1980)). Los subrayados más largos de siete nucleótidos se refieren a áreas que contienen sitios de consenso TATA que solapan. 55 60 La Figura 3A muestra la alineación de los homólogos del componente S mostrando regiones seleccionadas que exhiben una conservación de aminoácidos máxima. Los huecos han sido introducidos para maximizar la alineación de aminoácidos idénticos según se describe en Métodos. La secuencia consenso (cons) indica los residuos que son compartidos por al menos todos los virus excepto uno y están indicadas por letras mayúsculas. En alineaciones entre más de dos secuencias, los asteriscos (∗) indican los residuos conservados por todos los virus. Los números de los aminoácidos (con respecto a 5’-ATG) de las regiones alineadas correspondientes están listados antes y después de cada secuencia. 4 ES 2 110 999 T3 5 10 15 20 25 La Figura 3B muestra los análisis de matrices de puntos que representan las homologı́as globales entre las comparaciones de homólogos del segmento S de MDV-herpesvirus alfa seleccionadas. Se generaban puntos donde se encontraban al menos 15 aminoácidos idénticos o similares sobre una longitud de ventana móvil de 30. Las diagonales resultantes ilustran las regiones que muestran la mayor conservación. Los números de los aminoácidos (con respecto a 5’-ATG) de las secuencias correspondientes se representan encima y a la derecha de cada gráfica. La Figura 4 muestra una comparación de la organización genómica global de los ORFs del componente S disponibles (Audonnet, J.-C., y col., J. Gen. Virol. 71:2969-2978 (1990); McGeoch, D.J., y col., J. Gen. Virol. 68:19-38 (1987); Tikoo, S.K., y col., J. Virol. 64:5132-5142 (1990); Van Zijl, M., y col., J. Gen. Virol. 71:1747-1755 (1990); Zhang, G., y col., J. Gen. Virol. 71:2433-2441 (1990); Cullinane, A.A., y col., J. Gen. Virol. 69:1575-1590 (1988); Davison, A.J., y col., J. Gen. Virol. 76:1759-1816 (1986); McGeoch, D.J., y col., J. Mol. Biol. 181:1-13 (1985); Petrovskis, E.A., y col., Virology 159:193-195 (1987); Petrovskis, E.A., y col., J. Virol. 60:185-193 (1986); y Petrovskis, E.A., y col., J. Virol. 59:216223 (1986)). Los números encima de cada ORF se refieren a homólogos sobre la base de la relación con la nomenclatura de los ORFs de US del HSV-1 (McGeoch, D.J., y col., J. Mol. Biol. 181:1-13 (1985)). Las denominaciones de polipéptidos alternativos comunes a cada sistema están listadas debajo de aquellos ORFs en los que era aplicable. Las barras sólidas de caja alta y caja baja se refieren a los ORFs dirigidos hacia la derecha y hacia la izquierda, respectivamente. La flechas se refieren a sitios de unión IRS -US y/o US -TRS identificados. El gen 4 del PRV es homólogo al US4 del HSV-2, en lugar de al US4 del HSV-1. La Figura 5 muestra la secuencia de etapas necesarias para producir un segmento completo de ADN del herpesvirus de la enfermedad de Marek que codifica la glicoproteı́na gI y la parte de gE incluida en la solicitud registrada el 24 de Agosto de 1990. Descripción general 30 35 La presente invención se refiere a un segmento de ADN que codifica el precursor de la glicoproteı́na gE entre la secuencia de nucleótidos 8488 y 9978 del ADN del herpesvirus de la enfermedad de Marek, y que contiene secuencias promotoras potenciales hasta 400 nucleótidos 5’ de cada gen, según se muestra en la Figura 2 (y se identifica como parte de la SEC ID N◦ :1) y a subfragmentos del ADN que reconocen el ADN. Además, la presente invención se refiere a los nuevos precursores de glicoproteı́nas que son producidos por expresiones de los genes de los segmentos de ADN. Además la presente invención se refiere a los promotores génicos potenciales del MDV, que están localizados en los 400 nucleótidos 5’ de cada secuencia codificadora. 40 Descripción especı́fica 45 La presente invención muestra un análisis de la secuencia de un tramo de ADN de 10,35 kpb que abarca la mayorı́a de la región US del MDV. En total se identificaron siete homólogos de US del MDV, incluyendo tres genes de glicoproteı́nas y dos marcos de lectura abierta especı́ficos del MDV adicionales. Ejemplo 1 Materiales y métodos 50 Plásmidos Recombinantes, subclonaje de M-13 y secuenciación del ADN 55 60 EcoR1-0 y EcoR1-I de MDV de la cepa patógena GA fueron clonados previamente en pBR328 (Gibbs, C.P., y col., Proc. Natl. Acad. Sci. USA 81:3365-3369 (1984)), (Silva, R.F., y col., J. Virol. 54:690-696 (1985)) y se hicieron disponibles por R.F. Silva, USDA Avian Disease and Oncology Lab, East Lansing, MI, donde se mantienen estos clones. BamHI-A y BamHI-P1 de la cepa GA fueron clonados previamente en pACYC184 y pBR322, respectivamente (Fukuchi, K., y col., J. Virol. 51:102-109 (1984)) y suministrados amablemente por M. Nonoyama, Showa University Research Institute, St. Petersburg, FL. El clon GA-02 de la cepa GA, un clon de EMBL-3 conteniendo un inserto de SalI de MDV parcialmente digerido, que contiene BamHI-A, -P1, y secuencias flanqueantes 5’ y 3’ adicionales (proporcionado amablemente por P. Sondermeier, Intervet Intl. B. V., Boxmeer, Paı́ses Bajos) fue utilizado para extender al análisis hacia la derecha de los fragmentos de EcoR1 y BamH1 anteriores. Este clon del fago fue utilizado para 5 ES 2 110 999 T3 5 10 15 20 25 30 generar subclones de pUC18 con insertos unidos a SalI más pequeños (pSP18-A, pSP18-B y pSP18-C) que contienen la región 3’ flanqueante de BamHI-P1. Estos clones (Figura 1B) fueron utilizados para generar subclones de M13mp18 y -19 para utilización como moldes para la secuenciación de nucleótidos. Se realizaron preparaciones de plásmidos a pequeña y a gran escala utilizando el procedimiento de lisis alcalina (Maniatis, T., y col., Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1982)). Los subclones de los fagos M13mp18 y M13mp19 para ser utilizados como moldes para la secuenciación fueron generados utilizando subfragmentos de restricción especı́ficos determinados por mapeo de restricción o por la utilización de conjuntos de ADN vı́rico digeridos con Sau3A, Taq I o RsaI ligados en los sitios únicos de BamHI, AccI o SmaI del ADN de M13 RF, respectivamente. En algunos casos se obtuvieron clones por deleción de M13 que solapaban por digestiones preparativas con Bal31 de los sitios de restricción de AccI, NaeI o NsiI en EcoR1-0 por el método de Poncz y col. (Poncz, M., y col., Proc. Natl. Acad. Sci. USA 79:4298-4302 (1982)). Se utilizaron métodos estándar (Maniatis, T., y col., Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1982)) para las digestiones de restricción, electroforesis en gel, purificación de los fragmentos de ADN a partir de geles de agarosa, ligaduras y rellenado de los salientes en 5’ con el fragmento Klenow. Los productos de M13 ligados fueron transformados en células huésped JM107 competentes con CaCl2 y se añadieron a una superficie de agar B fundido conteniendo 10 l de IPTG 100 mM, 50 l de X-gal al 2% y 200 l de un cultivo fresco de JM101 de una noche. Estos contenidos se plaquearon posteriormente en placas de agar B y se incubaron a 37◦C durante una noche. Las placas recombinantes (claras) se utilizaron luego para infectar 5 ml de medio YT diluido 1:50 con un cultivo de una noche de JM101 y se rotaron a 37◦ C durante 6 horas. Las células resultantes fueron aglutinadas por centrifugación durante 5 minutos a temperatura ambiente y se retiraron los sobrenadantes y se almacenaron a 4◦C para conservar cepas vı́ricas de cada clon recombinante. Utilizando los sobrenadantes recuperados, se aisló ADN del fago M13 de hebra sencilla para ser utilizado como molde en la secuenciación de ADN por el método de la terminación de la cadena didesoxi según las instrucciones del Manual de Instrucciones para el Clonaje/Secuenciación con Didesoxi de M13 suministrado por Bethesda Research Laboratories. Los fagos M13mp recombinantes fueron posteriormente seleccionados mediante electroforesis de ADN vı́rico de hebra sencilla purificado en minigeles de agarosa al 1% y seleccionando aquellos moldes que mostraban una movilidad reducida en comparación con el ADN control de M13mp18 de hebra sencilla. 35 40 45 50 55 La secuenciación del ADN con moldes de M13 de hebra sencilla fue realizada por el método de la terminación de la cadena didesoxi (Sanger, F.S., y col., Proc. Natl. Acad. Sci. USA 74:5463-5467 (1977)) empleando la ADN polimerasa T7 modificada, SequenaseTM (United States Biochemical Corp., Cleveland, Ohio). Un resumen de la estrategia para la secuenciación está incluido en la Figura 1B. Para las reacciones de secuenciación del ADN, se emplearon las instrucciones especı́ficas etapa por etapa proporcionadas con el kit para secuenciación con SequenaseTM . Brevemente, los moldes de M13 de hebra sencilla fueron unidos primero con el cebador oligonucleotı́dico sintético universal de M13 por incubación a 65◦ C durante 2 minutos seguido por enfriamiento lento hasta que la temperatura de incubación estaba por debajo de 30◦C. Después de la adición de las mezclas apropiadas de desoxi y didesoxinucleótidos trifosfato (dNTPs y ddNTPs, respectivamente), de desoxiadenosina 5’-(alfa-tio) trifosfato marcada radioactivamente (35 SdATP, 1000-1500 Ci/mmol; NEN-DuPont) y del enzima SequenaseTM , se inició la sı́ntesis de las hebras complementarias marcadas radioactivamente a partir del cebador fijado. Cuatro reacciones de sı́ntesis separadas se terminaron cada una por la incorporación del ddNTP especı́fico (ddATP, ddGTP, ddTTP o ddCTP) utilizado en cada tubo. Los productos de reacción fueron sometidos a electroforesis a través de geles de poliacrilamida 7%/urea 50%/Tris-Borato-EDTA y las cadenas marcadas fueron visualizadas por autorradiografı́a. Ambas hebras fueron secuenciadas al menos una vez. Esto fue facilitado por la utilización de 16 oligonucleótidos 17-meros sintéticos generados sobre la base de secuencias determinadas previamente y sustituyeron al cebador universal bajo condiciones de reacción similares a las anteriores (0,5 pmoles/reacción) de acuerdo con la aproximación general descrita por Strauss (Strauss, E.C., y col., Anal. Biochem. 154:353-360 (1986)). Análisis de los datos de las secuencias 60 Las secuencias fueron ensambladas y analizadas en un microordenador personal IBM System 2/Modelo 50 utilizando los paquetes de programas para análisis de secuencias IBI/Pustell (Pustell, J., y col., Nucl. Acids Res. 14:479-488 (1986)) y Genepro (Versión 4.10; Riverside Scientific Enterprises, Seattle, WA) o programas obtenidos del University of Wisconsin Genetics Computer Group (GCG; Devereaux, J., 6 ES 2 110 999 T3 5 10 15 20 25 y col., Nucl. Acids Res. 12:387-395 (1984)) y ejecutados en un miniordenador VAX 8650. Las búsquedas de las bases de datos de la National Biochemical Research Foundation-Protein (NBRF-Protein, Emisión 21,0, 6/89) se realizaron con el programa FASTA del GCG (Pearson, W.R., y col., Proc. Natl. Acad. Sci. USA 85:2444-2448 (1988)) que utiliza: (1) una modificación del algoritmo de Wilbur y Lipman (Wilbur, W.J., y col., Proc. Natl. Acad. Sci. USA 80:726-730 (1983)) para localizar las regiones de similitud; (2) un sistema de puntuación basado en PAM250 (Dayhoff, M.O., y col., p. 345-352. En M.O. Dayhoff (ed.), Atlas of protein sequence and structure, vol. 5, Supl. 3. National Biomedical Research Foundation, Washington, D.C. (1978)) y (3) el procedimiento de alineación de Smith y Waterman (Smith, T.F., y col., Adv. Appl. Mathematics 2:482-489 (1981)) para unir, cuando fuera posible, las regiones con la mayor puntuación que no solapaban con el fin de derivar una alineación y su puntuación optimizada resultante. Se generaron representaciones gráficas de homologı́a de matrices de puntos utilizando el programa DOTPLOT del GCG con el archivo de salida del COMPARE del GCG. Este último crea un archivo de los puntos de similitud entre dos secuencias de aminoácidos pronosticadas para las que se eligieron una longitud de ventana de 30 y una severidad de 15 (en las que las sustituciones de aminoácidos conservadoras son puntuadas como positivas). Utilizando el programa GAP del GCG, se alinearon secuencias de aminoácidos especı́ficas utilizando el algoritmo de Needleman y Wunsch (Needleman, S.B., y col., J. Mol. Biol. 48:443-453 (1970)); después de la inserción de huecos (para maximizar el número de coincidencias) se determinó el porcentaje de residuos de aminoácidos idénticos y similares. Con el fin de crear alineaciones múltiples utilizando el GAP, se crearon archivos de salida de secuencias del MDV con huecos después de comparaciones sucesivas con el GAP entre la secuencia del MDV y sus secuencias homólogas (en orden de homologı́a descendente). Estos archivos de salida fueron utilizados como secuencias de entrada para ejecuciones posteriores del GAP hasta que la alineación de estas secuencias con huecos ya no pudo expandirse más por la adición de nuevos huecos. Después de la alineación, se mostraron los archivos de salida con huecos y se calculó una secuencia consenso utilizando el programa PRETTY del GCG. Con el fin de conseguir resultados óptimos, se empleó en algunos casos una edición manual (utilizando el LINEUP del GCG). Resultados 30 35 40 La secuencia de ADN de 10.350 nucleótidos presentada (Figura 2) parece abarcar la mayorı́a de la región corta única (US ) del genoma del MDV (GA). Un resumen de la estrategia de secuenciación está incluido en Materiales y Métodos y se representa en la Figura 1B. Esta secuencia abarca los fragmentos de US , EcoR1-0, EcoR1-I y se extiende hasta un sitio de SalI 1,55 kpb corriente abajo del extremo 3’ de BamHI-P1 (Figuras 1A y 1B). Fukuchi y col. (Fukuchi, K., y col., J. Virol. 51:102-109 (1984)) han mapeado previamente la unión IRS -US hasta un fragmento de Bgl I de 1,4 kb situado en el segundo de cinco subfragmentos de EcoR1 de BamHI-A (Figura 1B). De este modo, a la secuencia aquı́ presentada deberı́an faltarle entre 2,6 y 4,0 kb de la región US 5’-proximal, asumiendo que la situación de la unión IRS -US anterior puede ser confirmada independientemente. Debido a que la región secuenciada no se extiende a una distancia suficiente corriente abajo de BamHI-P1, la unión US -TRS del MDV no ha sido todavı́a definida con precisión (Davison, A.J., y col., J. Gen. Virol. 76:1759-1816 (1986)). Para VZV, EHV-4 y HSV-1, este lı́mite está situado alrededor de 100 pb corriente arriba, o 1,1 y 2,7 kb corriente abajo, respectivamente, del codon de terminación de sus homólogos de US8 respectivos (Cullinane, A.A., y col., J. Gen. Virol. 69:1575-1590 (1988); Davison, A.J., y col., J. Gen. Virol. 76:1759-1816 (1986) y McGeoch, D.J., y col., J. Gen. Virol., 69:1531-1574 (1988)). 45 50 55 60 Se encontró que el contenido global de G+C de la región secuenciada era del 41%, algo inferior a los valores de G+C genómicos del MDV del 46% (Lee, L.F., y col., J. Virol. 7:289 (1971)). Las frecuencias observadas de dinucleótidos CpG en la secuencia completa, o en las regiones codificadoras solamente, no diferı́a significativamente de las esperadas a partir de sus composiciones de mononucleótidos (datos no mostrados). Este resultado concuerda con los obtenidos a partir de los herpesvirus alfa, mientras que contrasta con los obtenidos de los herpesvirus gamma, tales como el HVS rico en A+T y el EBV rico en G+C, que son ambos deficientes en dinucleótidos CpG (Honess, R.W., y col., J. Gen. Virol. 70:837-855 (1989)). La región secuenciada contiene 9 ORFs completos para codificar probablemente proteı́nas (Fig. 1C, las bases para los nombres se dan posteriormente). Esta predicción estaba basada en: (1) comparaciones de la homologı́a y de la organización posicional con otros genes de los herpesvirus alfa y (2) presencia de TATA y de secuencias consenso de poliadenilación potenciales (Birnstiel, M.L., y col., Cell 41:349-359 (1985) y Corden, B., y col., Science 209:1406-1414 (1980)) y (3) posesión de contextos favorables para la iniciación de la traducción (Kozak, M., J. Cell. Biol. 108:229-241 (1989)). Esta identificación estaba guiada además por la observación de que los herpesvirus alfa tales como HSV y VZV tienden a contener regiones codificadoras relativamente estrechamente empaquetadas, no ayustadas y generalmente que no 7 ES 2 110 999 T3 5 10 15 20 25 solapan (Davison, A.J., y col., J. Gen. Virol. 76:1759-1816 (1986); McGeoch, D.J., y col., J. Gen. Virol. 69:1531-1574 (1988); McGeoch, D.J., y col., J. Mol. Biol. 181:1-13 (1985) y McGeoch, D.J., y col., J. Gen. Virol. 68:19-38 (1987)). Tales genes, especialmente los de las regiones US , comparten a menudo señales de poliadenilación, dando lugar por ello a familias de ARNm 3’-coterminales (Rixon, F.J., y col., Nucl. Acids Res. 13:953-973 (1985)). Los métodos para detectar las regiones que codifican proteı́nas sobre la base de la utilización de tablas de frecuencia de codones derivadas de MDV (utilizando éstas y secuencias del MDV publicadas previamente, Binns, M.M., y col., Virus res. 12:371-382 (1989); Ross, L.J.N., y col., J. Gen. Virol. 70:1789-1804 (1989) y Scott, S.D., y col., J. Gen. Virol. 70:3055-3065 (1989)) o el análisis de la predisposición composicional (utilizando los programas CODONPREFERENCE y TESTCODE del GCG) fueron muy poco concluyentes, sugiriendo que el MDV posee predisposiciones de codones y composicionales relativamente bajas en comparación con las pronosticadas sobre la base de su composición de mononucleótidos. Sin embargo, utilizando el programa FRAMES del GCG, junto con la tabla anterior de frecuencia de codones derivada del MDV, los 9 ORFs identificados muestran claramente un patrón significativamente bajo de utilización de codones poco comunes, que contrasta intensamente con el observado en todas las otras regiones potencialmente traducibles (datos no mostrados). Las secuencias de aminoácidos pronosticadas de los ORFs pronosticados (comenzando a partir del primer codon ATG) están mostradas con relación a la secuencia de nucleótidos de la Figura 2. Los sitios TATA potenciales dentro de los 400 nucleótidos del codon de iniciación están subrayados. Los ORFs propuestos y las situaciones de las señales de poliadenilación potenciales, la identificación de los nucleótidos del contexto de ATG -3, +4 (Kozak, M., J. Cell Biol. 108:229-241 (1989)), ası́ como las longitudes, las masas moleculares relativas y los puntos isoeléctricos pronosticados de los productos traduccionales pronosticados se muestran en la Tabla 1. Un resumen de los datos del MDV se muestra en la Tabla 1, con la situación de los ORFs, las señales de poliadenilación pronosticadas utilizadas, los nucleótidos del contexto traduccional, las longitudes, los tamaños moleculares relativos y los puntos isoeléctricos de los productos de la traducción pronosticados. TABLA 1 30 Tamañob Sitio de Nucleótidos Molecular Inicio Final Poliadenilación del Contexto Longitud Pronosticado pIc del ORF del ORF Pronosticado de ATG -3, +4 (aa) (kDa) Pronosticado a 35 Nombre US1 US10 SORF1 US2 US3 SORF2 US6 US7 US8 40 45 248 1077 2884 3923 4062 5353 5964 7282 8488 784 1715 1832 3114 5240 5793 7172 8346 9978 1777 1777 1790 1790 5394 5904 10040 10040 10040 A,A G,G A,A A,G A,G C,G G,G G,T A,T 179 213 351 270 393 147 403 355 497 20,4 23,6 40,6 29,7 43,8 16,7 42,6d 38,3d 53,7d 6,5 8,2 8,2 7,6 6,1 9,8 10,3d 6,7d 8,0d a 50 55 60 Nucleótidos enumerados con relación a las posiciones -3, +4, respectivamente; la numeración comienza con la A del codon ATG (AUG) como posición +1; a los nucleótidos 5’ a ese sitio se les asignan números negativos. b En ausencia de modificaciones post-traduccionales. c Calculado utilizando el programa del GCG, ISOELECTRIC. d Basado en las secuencias que siguen al sitio de corte del péptido señal pronosticado. En ausencia de información previa concerniente a estos ORFs del MDV, y para simplificar la identificación, han sido nombrados (Figura 1C, Tabla 1) sobre la base de las relaciones homólogas con los ORFs de US codificados por HSV-1 (McGeoch, D.J., y col., J. Mol. Biol. 181:1-13 (1985)). Cuando sea apropiado, las letras MDV precederán al nombre del homólogo para indicar el origen del ORF. Los dos ORFs especı́ficos del MDV han sido denominados arbitrariamente SORF1 y SORF2, sobre la base de su situación en el componente S. 8 ES 2 110 999 T3 5 10 15 20 25 30 De acuerdo con el modelo de barrido para la traducción, la subunidad ribosómica de 40S se une inicialmente al extremo 5’ del ARNm y luego migra, deteniéndose en el primer codon AUG (ATG) en un contexto favorable para iniciar la traducción (Kozak, M., J. Cell Biol. 108:229-241 (1989)). Sin embargo, en ausencia de la nucleasa S1 y/o del análisis de extensión de los cebadores, los sitios de inicio de la traducción definitivos no pueden ser pronosticados con exactitud. Sin embargo, los sitios de iniciación probables están enumerados en la Tabla 1; éstos se refieren a la situación del primer codon ATG dentro del marco encontrado en el marco de lectura abierta principal. Según Kozak (Kozak, M., J. Cell Biol. 108:229-241 (1989)), mientras haya una purina en la posición -3, las desviaciones del resto del consenso sólo perjudican marginalmente la iniciación. En ausencia de tal purina, sin embargo, una guanina en la posición +4 es esencial para una traducción eficaz. La Tabla 1 muestra que todos los ORFs, excepto el SORF2, contienen el importante residuo de purina en la posición -3. No obstante, en el caso de SORF2, una guanina compensadora en la posición +4 está en efecto presente. En el caso del US1 del MDV, dos sitios cap transcripcionales han sido identificados tentativamente por análisis de protección a la nucleasa S1 en 5’ (datos no mostrados). Estos sitios parecen estar situados 18 y 25 nucleótidos corriente abajo de una secuencia TATATAA en la posición 200 y 207, respectivamente (Figura 2). Sobre la base de los datos de S1 en 3’, este transcrito utiliza una señal de poliadenilación situada justo corriente abajo de la región codificadora US10 (Tabla 1, datos no mostrados). Los análisis de transferencia Northern comparativos de la región US indican que el transcrito de US1 del MDV parece ser el transcrito más importante expresado a tiempos tardı́os (72 h) post-infección cuando se observan extensos efectos citopáticos (datos no mostrados). Los estudios de inhibición con ácido fosfonoacético han indicado que el US1 del MDV, en contraste con su equivalente US1 del HSV-1 inmediato temprano, está regulado como un gen de clase tardı́a (datos no mostrados). Utilizando el programa de ordenador FASTA (Pearson, W.R., y col., Proc. Natl. Acad. Sci. USA 85:2444-2448 (1988)) con un valor K-tuple de 1, cada una de las 9 secuencias de aminoácidos pronosticadas fue sometida a selección frente a la base de datos NBRF-Proteı́na (Emisión 21,0, 6/89), y frente a las secuencias génicas (11) del segmento S del EHV-4 recientemente publicadas. Se consideró que las puntuaciones del FASTA optimizadas mayores de 100 indicaban generalmente un grado significativo de similitud de aminoácidos. Los resultados de este análisis están en la Tabla 2. TABLA 2 Comparaciones emparejadas de los homólogos del componente S del MDV y de los herpesvirus alfa 35 US1 40 % Similares % idénticos 45 50 55 Puntuaciones del PASTA US10 Virus MDV HSV-1 VZV PRV EHV-4 MDV HSV-1 VZV EHV-4 MDV HSV-1 VZV PRV EHV-4 47/26 43/27 51/33 48/30 47/26 49/29 43/25 50/29 43/27 49/29 51/35 54/36 51/33 43/25 51/35 56/41 48/30 50/29 54/36 56/41 - 45/24 40/24 45/24 49/27 40/24 49/27 a a a 45/29 49/27 55/32 45/29 49/27 55/32 a - MDV HSV-1 VZV PRV EHV-4 891 101 160 218 208 101 2,047 119 201 150 160 218 119 201 1,378 340 340 1,724 359 525 208 150 359 525 1,308 1,071 134 147 a 251 134 1,617 123 a 180 147 123 978 a 191 251 180 191 a 1,312 Longitud (aa) 179 420 ∗273 213 312 180 259 278 60 9 364 ES 2 110 999 T3 TABLA 2 (Continuación) US2 5 % Similares % idénticos 10 Puntuaciones del PASTA 15 US3 MDV HSV-1 PRV MDV HSV-1 VZV PRP 51/33 a 48/26 a 51/33 a 50/31 a 48/26 50/31 a a 56/38 54/33 55/33 a 56/38 57/41 59/36 a 54/33 57/41 58/35 a 55/33 59/36 58/35 a 1,421 335 a ∗∗168 a 335 1,554 a 112 a ∗∗118 112 a 1,240 a 1,931 611 616 563 a 611 2,409 717 620 a 616 717 1,960 595 a 563 620 595 1,948 a 270 291 256 393 481 393 390 20 US6 25 % Similares % idénticos 30 35 40 Puntuaciones del PASTA US7 Virus MDV MSV-1 PRV EHV-1 BHV-1 MDV HSV-1 VZV PRV EHV-1 MDV HSV-1 VZV PRV EHV-1 BHV-1 42/21 b 44/23 43/21 42/33 MDV HSV-1 VZV PRV EHV-4 BHV-1 2,068 211 279 246 211 1,999 294 253 b b b b 279 294 2,116 428 246 253 428 1,995 291 304 730 494 Longitud (aa) 403 42/21 b 47/27 44/22 50/28 394 44/23 47/27 b 51/30 57/38 43/21 44/22 b 51/30 52/30 402 395 42/33 50/28 b 57/38 52/30 - 39/22 46/23 43/25 41/23 a 39/22 43/24 41/26 42/23 a 46/23 43/24 47/25 46/29 a 43/25 41/26 47/25 51/30 a 41/23 42/23 46/29 51/30 a 291 1,816 145 228 184 242 304 145 1,880 234 188 249 b 228 234 1,705 198 298 730 188 188 198 1,652 274 494 242 249 298 274 1,979 2,148 a a a a a 417 355 390 354 350 424 US8 MDV HSV-1 VZV PRV EHV-1 45 % Similares % idénticos 50 44/22 43/22 46/28 47/22 a 44/22 46/27 49/28 41/23 a 43/22 46/27 49/29 50/28 a 46/28 49/28 47/25 54/34 a 47/22 41/23 46/29 54/34 a 2,489 192 376 ∗∗243 399 192 2,751 357 257 274 Puntuaciones 376 357 3,171 329 468 del PASTA ∗∗217 257 329 2,923 417 399 274 468 417 2,821 a a a a a 55 497 60 10 550 623 577 552 ES 2 110 999 T3 a existencia de homólogos no determinada b 5 c la longitud real diferirá algo, debido a que el codon de iniciación probable no está definido d 10 15 20 25 30 35 40 45 50 55 60 no hay un homólogo presente en el genoma puntuación diferente cuando se invierte el orden de comparación Aunque SORF1 y SORF2 no parecen compartir ninguna homologı́a significativa con ninguna de las secuencias de la base de datos (datos no mostrados), aparte del US3 del MDV, se encontró que los otros seis ORFs (US1, 10, 2, 6, 7 y 8 del MDV; Tablas 1, 2) eran homólogos a los genes del segmento S de los herpesvirus alfa exclusivamente (Tabla 2). Debido a que el ORF de US3 representa un miembro de la superfamilia de las proteı́na quinasas de serina-treonina (Hanks, S.K., y col., Science 241:42- (1988)), se obtuvo un número de puntuaciones por encima de 150 relativamente grande. Sin embargo, estas puntuaciones fueron 3-4 veces más bajas que las obtenidas en comparaciones con los homólogos de US3 de HSV, PRV y VZV. Con el fin de comparar con las homologı́as del segmento S de los herpesvirus alfa previamente establecidas, se incluyen todas las comparaciones posibles del FASTA entre los siete grupos de secuencias relacionadas con los herpesvirus alfa. Se utilizó el programa GAP en comparaciones de parejas similares para generar alineaciones óptimas con el fin de determinar el porcentaje total de aminoácidos idénticos y similares compartidos por las dos secuencias. Según se muestra en la Tabla 2, las comparaciones de homologı́a entre los ORFs del segmento S del MDV y sus equivalentes de herpesvirus alfa fueron comparables a las observadas previamente entre los otros mismos homólogos del segmento S de los herpesvirus alfa. En algunos casos se encontró que los ORFs del MDV estaban más relacionados con los homólogos de los herpesvirus alfa que esos mismos homólogos lo estaban con sus otros equivalentes de los herpesvirus alfa (comparar las homologı́as del US1 de MDV/EHV-4 frente a las del HSV-1/EHV-4 y del US10 de MDV/EHV-4 frente a las del HSV-1/EHV-4). Además, a pesar del hecho de que el VZV carece de homólogos de US2 y US6, el MDV, aunque considerado formalmente un herpesvirus gamma, posee claramente homólogos de US2 y US6. Los resultados de las alineaciones múltiples limitadas para cada uno de los siete homólogos en las áreas que muestran la mejor conservación están representados en la Figura 3A. Las representaciones gráficas de homologı́a por matrices de puntos que representan las homologı́as totales entre las comparaciones de los homólogos del segmento S de MDV-herpesvirus alfa seleccionadas están incluidas en la Figura 3B. (Utilizando una longitud de ventana móvil de 30 aminoácidos, en la que se generan puntos cuando se encuentra que al menos 15 aminoácidos son idénticos o similares). Las diagonales resultantes ilustran las regiones que muestran la mayor conservación. Tales regiones incluyen y en algunos casos se extienden sobre las regiones representadas en la Figura 3A. Se hicieron intentos más sensibles para identificar otras proteı́nas relacionadas no detectadas con FASTA utilizando los programas PROFILE y PROFILESEARCH del GCG. La utilización de estos programas permite comparaciones con bases de datos que se basan en la información disponible a partir de estudios estructurales y, en este caso, de la información implı́cita en las alineaciones de los ORFs del componente S relacionados (incluyendo secuencias del MDV utilizando GAP) (Gribskov, M., y col., Proc. Natl. Acad. Sci. USA 84:4355-4358 (1987)); no obstante, tales análisis no se extendieron sobre los grupos de proteı́nas relacionadas aquı́ descritas. Se ha encontrado que los homólogos de las glicoproteı́nas de los herpesvirus contienen generalmente patrones similares de residuos de cisteı́na conservados. Al comparar los homólogos de gB de siete herpesvirus diferentes incluidos en las subclases de herpesvirus alfa, beta y gamma, existe una conservación completa de 10 residuos de cisteı́na (Ross, L.J.N., y col., J. Gen. Virol. 70:1789-1804 (1989)). El US6 (gD) del HSV-1 contiene 7 residuos de cisteı́na: seis parecen crı́ticos para un plegamiento correcto, para la estructura antigénica y para el grado de procesamiento del oligosacárido (Wilcox, W.C., y col., J. Virol. 62:1941-1947 (1988)). No sólo este mismo patrón general de cisteı́nas está conservado en los homólogos de gD del HSV-2 (McGeoch, D.J., y col., J. Gen. Virol. 68:19-38 (1987)) y del PRV (Petrovskis, E.A., y col., J. Virol. 59:216-223 (1986)), sino que se conserva también en el homólogo de gD del MDV (no se muestra la alineación completa). La Figura 3A representa las porciones de los patrones de conservación de cisteı́nas observados entre los homólogos de US6 (gD), US7 (gI) y US8 (gE) (en cuyo caso se muestran 4, 3 y 6 residuos de cisteı́na conservados, respectivamente). Mientras que los homólogos de US8 de MDV, VZV, PREV y EHV-1 (Audonnet, J.-C., y col., J. Gen. Virol. 71:2969-2978 (1990); Davison, A.J., y col., J. Gen. Virol. 76:1759-1816 (1986) y Petrovskis, E.A., y col., J. Virol. 60:185-193 (1986)) comparten todos un patrón similar de cuatro residuos de cisteı́na conservados próximos a sus extremos amino, los equivalentes de HSV-1 y -2 llevan sólo dos de éstos (McGeoch, D.J., J. Gen. Virol. 71:2361-2367 (1990); 11 ES 2 110 999 T3 5 10 15 datos no mostrados). Es bastante posible que el único patrón de cuatro cisteı́nas conservadas pudiera facilitar la formación de estructuras secundarias y terciarias diferentes que podrı́an transmitir consecuencias funcionales importantes. Éstas podrı́an estar reflejadas por hallazgos que muestran que la gE del HSV-1 tiene actividad de receptor Fc (Johnson, D.C., y col., J. Virol. 62:1347-1354 (1988)), mientras que sus equivalentes de PRV y VZV no la tienen (Edson, C.M., y col., Virology, 161:599-602 (1987) y Zuckerman, F.A., y col., J. Virol. 62:4622-4626 (1988)). Una inspección cuidadosa de las regiones N-terminales de los homólogos de gD, gI y gE del MDV ha revelado que contienen los tres bloques de construcción básicos de las secuencias peptı́dicas señal: una región N-terminal básica, cargada positivamente (región n), una región hidrofóbica central (región h) y una región terminal más polar (región c) que parece definir el sitio de corte (von Heijne, G., J. Mol. Biol. 184:99-105 (1985)). Utilizando un método recientemente mejorado para predecir los sitios de corte de las secuencias señal (von Heijne, G., Nucl. Acids Res. 14:4683-4690 (1986)), la Tabla 3 muestra la posición probable de estos sitios, la situación del dominio transmembrana hidrofóbico y del dominio citoplásmico cargado cerca del extremo C-terminal y la situación de los sitios potenciales de N-glicosilación. La Tabla 3 muestra los datos de las glicoproteı́nas de US del MDV sobre los sitios de corte del péptido señal pronosticados y las situaciones de los dominios transmembrana y citoplásmico y de los sitios potenciales de N-glicosilación (con respecto al codon de iniciación ATG). 20 TABLA 3 Nombre Sitio de Corte del Péptido Señal Pronosticado Dominio Transmembrana Dominio Citoplásmico Sitios de N-glicosilación US6 US7 US8 G30 -D31 S18 -I19 T18 -A19 358-374 269-288 394-419 375-403 289-355 420-497 87, 138, 230, 306 147, 167, 210, 245, 253 60, 133, 148, 203, 229, 277, 366, 388 25 30 35 40 45 50 55 60 Igual que los otros homólogos de gI, el equivalente del MDV contiene un dominio citoplásmico relativamente largo. Sin embargo, en contraste con los otros homólogos de gD, el péptido señal de gD del MDV contiene una región n relativamente larga (18 residuos), que está inusualmente muy cargada (+4; Figura 2) considerando un valor medio global de +1,7 entre los eucariotes, que generalmente no varı́a con la longitud (von Heijne, G., J. Mol. Biol. 184:99-105 (1985)). Aunque existe un codon de metionina más distal directamente antes del codon de iniciación (como en el homólogo de gD del PRV, Petrovskis, E.A., y col., J. Virol. 59:216-223 (1986)) el modelo de barrido para la traducción (Gribskov, M., y col., Proc. Natl. Acad. Sci. USA 84:4355-4358 (1987)) favorece la utilización del codon de iniciación más 5’-proximal (en la posición 5964, Figura 2). Un apoyo adicional está basado en un contexto de traducción global que parece al menos tan bueno como, si no mejor que, el correspondiente al ATG corriente abajo. A pesar de tal predicción, la situación de un sitio cap posible del ARNm entre los dos sitios ATG, que podrı́a imposibilitar tal predicción, no puede ser excluida en este punto. Un punto final concerniente a gD del MDV requiere mención. Utilizando la secuencia de ADN de 10.350 nucleótidos como sonda para someter a selección las bases de datos de ácidos nucleicos GenBank (62,0, 12/89) y EMBL (19,0, 5/89) con el programa de ordenador FASTA (K-tuple=6), una puntuación optimizada de 1027, correspondiente a una identidad de nucleótidos del 91,5% en un solapamiento de 342 pb entre las secuencias codificadoras de gD del MDV (6479-6814; aa#173-aa#284; Figura 2) y un segmento de ADN del MDV de 467 pb informado previamente (Wen, L.-T., y col., J. Virol. 62:3764-3771 (1988)). Se ha informado que esta última secuencia contiene un segmento de 60 pb protegido contra la digestión con ADNasa mediante la unión de un antı́geno nuclear del MDV (MDNA) de 28 kD expresado solamente en células linfoblastoides transformadas con MDV infectadas “latentemente”. En vista de las similitudes entre MDV y VZV, estos autores sugirieron que MDNA puede funcionar de una manera análoga a la de EBNA-1 en la inmortalización de células de primates. En su informe, Wen y col.(Wen, L.-T., y col., J. Virol. 62:3764-3771 (1988)) mapearon el sitio de unión del MDNA al mismo subfragmento de EcoRI de BamHI-A en el que está situado gD del MDV (EcoRI-I, Figura 1). Aunque nuestra secuencia que cubre esta región es consistente con un ORF completo, ininterrumpido que contiene todos los rasgos caracterı́sticos de una glicoproteı́na, y que muestra una homologı́a significativa con gD del HSV, su secuencia contiene alrededor de 140 bases de una secuencia 5’-proximal no relacionada con ninguna 12 ES 2 110 999 T3 determinada a partir de nuestro fragmento de EcoR1-I de 5,3 kpb o de sus secuencias colindantes de 3,5 kb. La secuencia de 327 pb restante (que contiene el supuesto sitio de unión del antı́geno nuclear) aunque se asemeja claramente a nuestra secuencia codificadora de gD, después de la traducción por ordenador fue incapaz de producir un ORF más largo de 30 aa. 5 Discusión 10 15 20 25 30 35 40 45 50 55 60 Datos recientes han mostrado que a pesar de la clasificación del MDV como un herpesvirus gamma, sobre la base de las propiedades linfotrópicas compartidas con otros miembros de esta subfamilia, su estructura genómica (Cebrian, J., y col., Proc. Natl. Acad. Sci. USA 79:555-558 (1982) y Fukuchi, K., y col., J. Virol. 51:102-109 (1984)) y la organización genética de su región UL principalmente (Buckmaster, A.E., y col., J. Gen. Virol. 69:2033-2042 (1988)) se asemeja más estrechamente a la de los herpesvirus alfa neurotrópicos. Además, en los casos en los que se encontraron secuencias polipeptı́dicas conservadas entre las tres subfamilias de herpesvirus (por ejemplo los genes UL ), se observaron consistentemente puntuaciones de homologı́a significativamente mayores frente a los equivalentes de los herpesvirus alfa que frente a los de los herpesvirus beta o gamma respectivos (Davison, A.J., y col., J. Gen. Virol. 67:597611 (1986); Buckmaster, A.E., y col., J. Gen. Virol. 69:2033-2042 (1988); Ross, L.J.N., y col., J. Gen. Virol. 70:1789-1804 (1989) y Scott, S.D., y col., J. Gen. Virol. 70:3055-3065 (1989)). Se ha encontrado previamente que los genes del segmento S de los herpesvirus alfa son únicos para los miembros de esta subfamilia taxonómica (Davison, A.J., y col., J. Gen. Virol. 68:1067-1079 (1987) y Davison, A.J., y col., J. Gen. Virol. 67:597-611 (1986)). La identificación de siete homólogos del MDV de genes del segmento S de los herpesvirus alfa en este estudio es consistente con la idea de que MDV comparte una relación evolutiva más estrecha con los herpesvirus alfa que con los herpesvirus gamma. Esto está apoyado además por el análisis de la frecuencia de dinucleótidos que es incapaz de mostrar una falta de la supresión de CpG como se observó entre todos los herpesvirus gamma hasta ahora ası́ estudiados (Efstathiou, S., y col., J. Gen. Virol. 71:1365-1372 (1990) y Honess, R.W., y col., J. Gen. Virol. 70:837-855 (1989)). La situación anterior se asemeja a una similar observada con el herpesvirus-6 humano (HHV-6), en cuyo caso su linfotropismo T sugirió una clasificación provisional como un herpesvirus gamma (Lopez, C., y col., J. Infect. Dis. 157:1271-1273 (1988)). Sin embargo, un análisis genético posterior ha mostrado una relación mayor entre el HHV-6 y el herpesvirus beta, citomegalovirus humano (HCMV; Lawrence, G.L., y col., J. Virol. 64:287-299 (1990)). Una comparación de la organización genética de los genes del segmento S de los herpesvirus alfa se presenta en la Figura 4. La organización de estos genes varı́a enormemente en algunos casos en la longitud, organización y grado de homologı́a globales. Sin embargo, las disposiciones génicas globales presentadas son consistentes con un modelo para justificar la divergencia de los herpesvirus alfa a partir de un antepasado común mediante varios acontecimientos de recombinación homóloga que tienen como resultado la expansión o contracción de las regiones repetidas invertidas y una pérdida o ganancia concomitante de gen(es) de US . En el caso de VZV, faltan seis homólogos del segmento S en comparación con HSV-1 (US2, US4, US5, US6, US11, US12). Algunos genes, tales como los homólogos de US1, muestran divergencias particulares en la secuencia y en la longitud. Comparados con HSV-1, los homólogos de US1 de MDV, VZV y EHV-4 carecen de aproximadamente 120 aa de secuencia comparable con la porción 5’-proximal de US1 del HSV-1 (alfa 22). Sobre la base del análisis de transferencia Northern, el análisis de protección a la nucleasa S1 y los estudios de inhibición con ácido fosfonoacético, en contraste con su equivalente del HSV-1 inmediato temprano relativamente no caracterizado, el gen US1 del MDV parece estar regulado como un gen de clase tardı́a abundantemente expresado (datos no mostrados). En contraste con los demás herpesvirus alfa, el MDV contiene dos ORFs aparentemente especı́ficos del MDV. Además, la región US del MDV parece contener de 2,6 a 4,0 kb aproximadamente de secuencias 5’-proximales adicionales. Sobre la base de una comparación de la Figura 4 y de la consideración del esquema de recombinación con expansión-contracción, parece probable que haya genes de US especı́ficos del MDV adicionales. Debido a que el MDV ha sido considerado mucho tiempo como un herpesvirus gamma, gran parte del trabajo previo que interpreta sus propiedades ha procedido por analogı́a con la asociación entre el EBV y las células B (Nonoyama, M., p. 333-341. En B. Roizman (ed.), The herpesviruses, vol. 1, Plenum Press (1982) y Wilbur, W.J., y col., Proc. Natl. Acad. Sci. USA 80:726-730 (1983)). Debido a una relación genética más estrecha con los herpesvirus alfa, y teniendo en cuenta el análisis anterior del HHV-6, nosotros estamos de acuerdo con Lawrence y col. (Lawrence, G.L., y col., J. Virol. 64:287-299 (1990)) en que es poco probable que las propiedades linfotrópicas de MDV y HVT estén determinadas por moléculas homólogas a EBV y en que una delimitación de las diferencias moleculares entre el MDV y los herpesvirus alfa neurotrópicos serı́a más provechosa para explicar las diferencias biológicas observadas que el empleo de analogı́as basadas en las propiedades de los herpesvirus gamma tales como EBV y HVS. 13 ES 2 110 999 T3 5 10 15 20 Para explicar tales diferencias, la región US de MDV puede ser particularmente importante. Con pocas excepciones, cada gen del componente L del HSV-1 posee un equivalente en VZV (McGeoch, D.J., y col., J. Gen. Virol. 69:1531-1574 (1988)); un número considerable de éstos están relacionados también con los genes de los herpesvirus beta y gamma (29 de 67 equivalentes del EBV con respecto a los genes de UL del VZV; Davison, A.J., y col., J. Gen. Virol. 68:1067-1079 (1987)). En contraste, los segmentos S de HSV-1 y de VZV difieren significativamente en tamaño y parecen estar entre las partes menos relacionadas de los dos genomas (Davison, A.J., y col., J. Gen. Virol. 67:597-611 (1986) y Davison, A.J., y col., J. Gen. Virol. 64:1927-1942 (1983)). Estudios recientes han mostrado que 11 de los 12 marcos de lectura abierta contenidos en el componente S del HSV-1 son prescindibles para el crecimiento en cultivo de células (Longnecker, R., y col., Proc. Natl. Acad. Sci. USA 84:4303-4307 (1987) y Weber, P.C., y col., Science 236:576-579 (1987)). El mantenimiento y evolución de tal grupo de genes prescindibles sugiere la presencia de funciones relevantes para la supervivencia de los virus en su nicho ecológico especı́fico en el huésped natural o en el huésped animal de laboratorio, más que la presencia de funciones necesarias para la replicación (Longnecker, R., y col., Proc. Natl. Acad. Sci. USA 84:4303-4307 (1987) y Weber, P.C., y col., Science 236:576-579 (1987)). Consistentes con tal hipótesis son los hallazgos de que mutantes del HSV que llevan deleciones especı́ficas de genes del componente S diferentes eran significativamente menos patógenos y exhibı́an una capacidad reducida para el establecimiento de la latencia en ratones (Meignier, B., y col., Virology 162:251-254 (1988)). Con respecto a esto último, existe evidencia que sugiere que el ARN transcrito de la región US del HSV puede estar implicado en el establecimiento y mantenimiento de un sistema de latencia in vitro empleando células fibroblastos de pulmón de feto humano (Scheck, A.C., y col., Intervirology 30:121-136 (1989)). Tomadas juntas, la(s) anterior(e)s evidencia(s) sugiere(n) papel(es) potencialmente importante(s) para los genes de US del MDV en el tropismo tisular, latencia y/o inducción de la transformación celular. 25 30 35 40 45 50 55 60 Una consideración de los tres homólogos gD, gI y gE identificados en esta invención da lugar a otras dos cuestiones de relevancia para el desarrollo de futuras vacunas. Los 11 genes de la región US del HSV-1 prescindibles para el crecimiento en cultivo de células descritos anteriormente incluyen US7 (gI) y US8 (gE) del HSV-1 (Longnecker, R., y col., Proc. Natl. Acad. Sci. USA 84:4303-4307 (1987) y Weber, P.C., y col., Science 236:576-579 (1987)). Asumiendo que los homólogos del MDV tienen las mismas propiedades, estos genes pueden ser útiles como sitios para la inserción de genes foráneos. Además puede ser muy probable que los dos mismos homólogos del MDV, y especialmente US8 (gE), estén implicados en las cuestiones relacionadas con la patogenicidad introducidas anteriormente. Especı́ficamente gE del HSV parece jugar un papel en la capacidad del HSV-1 para establecer infecciones letales y latencia en ratones (Meignier, B., y col., Virology 162:251-254 (1988)). Además, los homólogos gI y gE del PRV de cerdos juegan un claro papel en la virulencia del PRV para pollos de 1 dı́a de edad y para cerdos jóvenes (Mettenleiter, Thomas C., y col., Journal of Virology, p. 4030-4032 (Dic. 1987)). Asumiendo que las mismas consideraciones son ciertas para los homólogos de US7 (gI) y US8 (gE) del MDV, puede ser posible inactivar uno de estos genes o ambos a partir de aislados muy virulentos de MDV que causen epidemias no prevenidas por las vacunas actuales, y crear con ello un virus vacuna atenuado relacionado más estrechamente con el virus de campo que causa las epidemias de la enfermedad. Una consideración más de los tres homólogos (gD, gI y gE) identificados en esta invención da lugar a otra interesante cuestión. Se sabe que los viriones infecciosos del MDV completamente envueltos son producidos solamente en las células epiteliales del folı́culo de las plumas (Payne, L.N., p. 347-431. En B. Roizman (ed.), The herpesviruses, vol. 1. Plenum Press (1982)). Debido a esto, los estudios del MDV han tenido que basarse en cultivos celulares de fibroblastos limitados que promueven solamente la propagación de las infecciones asociadas a células in vitro. Durante los últimos 20 años, los estudios dirigidos a la identificación de antı́genos de superficie inmunogénicos se han basado en este sistema de cultivo in vitro y en total solamente dos antı́genos glicoproteicos (antı́geno A/homólogo gC; antı́geno B) han sido identificados y caracterizados de forma rutinaria (Binns, M.M., y col., Virus Res. 12:371-382 (1989); Coussens, P.M., y col., J. Virol. 62:2373-2379 (1988); Isfort, R.J., y col., J. Virol. 59:411-419 (1986); Isfort, R.J., y col., J. Virol. 57:464-474 (1986) y Sithole, I., y col., J. Virol. 62:4270-4279 (1988)). Esto es a pesar de los hallazgos de los tres homólogos gD, gI y gE del MDV de la presente invención y de dos homólogos de glicoproteı́nas adicionales (gB y gH, Buckmaster, A.E., y col., J. Gen. Virol. 69:2033-2042 (1988) y Ross, L.J.N., y col., J. Gen. Virol. 70:1789-1804 (1989)). Aunque es probable que los sueros de pollos inmunes (ICS) procedentes de pájaros infectados de forma natural reaccionen con muchos, si no con todos, los antı́genos de superficie codificados por el MDV, estos sueros policlonales complejos serı́an útiles solamente hasta el punto en que la expresión/procesamiento del antı́geno en cultivo de células semiproductivo se asemeje a la de las células epiteliales del folı́culo de las plumas. El análisis de transferencia Northern utilizando sondas especı́ficas para gD del MDV sugiere que el ARNm de gD del MDV o no se expresa o se expresa pobremente en las células DEF en el momento en que se 14 ES 2 110 999 T3 5 10 observan extensos efectos citopáticos (datos no mostrados). A la luz del hecho de que el VZV carece de un homólogo gD y de que está fuertemente asociado a las células, será interesante ver si se encuentra que el bloqueo de la formación del virión del MDV en células fibroblastos de aves primarios se correlaciona con la falta de expresión (en estas células) de una glicoproteı́na, tal como gD, y/o de otro(s) gen(es) del componente S. Debido a que la protección contra MD conferida por cepas de MDV (serotipo 2) o HVT (serotipo 3) atenuadas parece tener una base inmunológica, existe un interés considerable en la identificación de antı́genos comunes. A la vista de esta invención que identifica siete homólogos de US del MDV con respecto a los genes de US del HSV (el último de los cuales está claramente menos relacionado con el MDV que el HVT), serı́a sorprendente si se probara que la información anterior que mostraba una falta de homologı́a entre las regiones US de MDV-HVT (Igarashi, T., y col., Virology 157:351-358 (1987)) fuera correcta. Tales resultados negativos pueden reflejar las limitaciones concernientes a las estimaciones de homologı́a basadas en la hibridación, en lugar de en los estudios del análisis de secuencias. 15 El Ejemplo 2 muestra el clonaje molecular de una construcción que contiene el ADN que codifica el gen US7 (gI) del MDV completo y parte del gen US8 (gE) del MDV. Como puede verse, esto se realiza utilizando segmentos de ADN que abarcan la región codificadora de gI y parte de la región codificadora de gE. 20 Ejemplo 2 Clonaje molecular de una construcción que contiene el ADN que codifica el US7 (gI) completo del MDV y parte del US8 (gE) del MDV 25 30 35 40 45 50 55 60 La construcción de un clon recombinante (pKS-MDgI1.59) conteniendo la secuencia codificadora de US7 (gI) del MDV completa y una porción de la secuencia codificadora de US8 (gE) del MDV requiere dos clones del MDV preexistentes, pKS-MDgD1.75 y p19P1 (Fig. 5). El pKS-MDgD1.75 es un plásmido recombinante que contiene el subfragmento NcoI-SstII de 1,75 kpb de EcoR1-I del MDV ligado en el sitio de SmaI-SstII del vector de clonaje, pBluescript KS-. Este clon contiene la secuencia codificadora completa de US6 (gD) del MDV y secuencias adicionales en el extremo 3’ que codifican los primeros 39 aminoácidos (aa) de gI del MDV. El p19P1 es un plásmido recombinante que contiene el subfragmento BamHI-P1 de 1,5 kpb del MDV clonado en el único sitio de BamHI del pUC19. Este clon contiene la secuencia codificadora completa de gI del MDV, excepto los 9 primeros aa de su secuencia señal. Además, en el extremo 3’, el p19P1 contiene los primeros 104 aa de la región codificadora de US8 (gE) del MDV. Para generar pKS-MDgI1.59, el pKS-MDgD1.75 es cortado primeramente con HincII, que corta una vez en el sitio de clonaje múltiple del vector pBluescript y una vez 180 pb aproximadamente corriente arriba del extremo SstII del inserto. Esto tiene como resultado dos fragmentos: un fragmento (1,6 kpb) consta primariamente de secuencias del inserto que codifican US6 (gD) del MDV; el fragmento más grande (3,1 kpb) consta de secuencias del vector pBluescript, además de 180 pb aproximadamente que codifican el extremo N de gI del MDV. El fragmento de 3,1 kb es purificado en gel y ligado consigo mismo por medio de los dos extremos HincII. El plásmido recombinante resultante, pKS-MDgI0.18, es luego cortado con SstI (en el sitio de clonaje múltiple, justo corriente abajo del sitio de SstII). Antes de la digestión posterior con SstII, los extremos SstI cohesivos se hacen extremos redondeados con ADN polimerasa T4. El fragmento SstII-SstI (redondeado) de 3,1 kpb resultante de pMDgI0.18 es purificado en gel y utilizado en la etapa final de ligadura para crear pKS-MDgI1.59. Mientras tienen lugar las manipulaciones enzimáticas de pKS-MDgD1.75 y pKS-MDgI0.18, p19P1 es cortado con HindIII, que corta justo corriente abajo de la secuencia codificadora parcial de US8 (gE) del MDV en el sitio de clonaje múltiple de pUC19. Antes de la digestión con SstIId, los extremos de HindIII cohesivos se hacen extremos redondeados utilizando el fragmento Klenow. El fragmento SstII-HindIII (redondeado) más pequeño (1,4 kpb) contiene una mayorı́a de la secuencia codificadora de US7 (gI) del MDV, además de 312 nucleótidos en el extremo 3’ que codifican el extremo 5’ de gE del MDV. Este fragmento SstII-HindIII (redondeado) de 1,4 kpb es purificado en gel y ligado al fragmento SstII-SstI (redondeado) de 3,1 kpb de pKS-MDgD0.18. El recombinante resultante, pKS-MDgI1.59, contiene la secuencia codificadora completa para gI del MDV y una porción de la secuencia codificadora de gE N-terminal. La digestión de pKS-MDgI1.59 con KpnI produce dos fragmentos; el fragmento más pequeño de 1,15 kpb contiene la secuencia codificadora completa para gI del MDV. El Ejemplo 3 muestra el subclonaje molecular de una construcción que contiene el gen US8 (gE) completo del MDV. 15 ES 2 110 999 T3 Ejemplo 3 Clonaje molecular de una construcción que codifica el US8 (gE) completo del MDV 5 10 La construcción de un clon recombinante (p18-MDgE2.53) conteniendo la secuencia codificadora completa de US8 (gE) del MDV requiere un clon distinto de los clones de BamHI o EcoR1 utilizados previamente. El clon GA-02 de la cepa GA, un clon de EMBL-3 que contiene un inserto de SalI de MDV parcialmente digerido, que contiene BamHI-A, -P1, y secuencias flanqueantes 5’ y 3’ adicionales (proporcionado amablemente por P. Sondermeier, Intervet Intl. B. V., Boxmeer, Paı́ses Bajos) fue utilizado para extender el análisis 3’ de los fragmentos EcoR1-I y BamH1-P1. Subfragmentos de SalI más pequeños situados en el extremo 3’ de este inserto del MDV en los clones del fago fueron purificados en gel y ligados a pUC18 linealizado con SalI (pSP18-A, pSP18-B y pSP18-C, Fig. 1B). El subclon de pUC18, pSP18-A contiene la secuencia codificadora completa de US8 (gE) del MDV y se denomina p18-MDgE2.53 a efectos del depósito en la ATCC. 15 Índice de definición de las letras de la Figura 2. La Tabla 4 muestra los aminoácidos con sus sı́mbolos de una letra y de tres letras. TABLA 4 20 25 30 35 40 A C D E F G H I K L Ala Cys Asp Glu Phe Gly His Ile Lys Leu Alanina Cisteı́na Ácido Aspártico Ácido Glutámico Fenilalanina Glicina Histidina Isoleucina Lisina Leucina M N P Q R S T V W Y Met Asn Pro Gln Arg Ser Thr Val Trp Tyr Metionina Asparragina Prolina Glutamina Arginina Serina Treonina Valina Triptófano Tirosina Cuando los segmentos de ADN que codifican las glicoproteı́nas gI y gE son alterados por mutagénesis por inserción, dirigida a un sitio o por deleción, puede reducirse la patogenicidad del MDV. Además, los segmentos de ADN que codifican las gI y gE no esenciales pueden ser utilizados como sitios para la inserción de segmentos de ADN foráneo que codifiquen proteı́nas que son antigénicamente activas con el fin de producir una vacuna recombinante. Depósito en la ATCC El gen para US6 del MDV (gD del MDV) ha sido depositado en un plásmido (phagemid) pKSMDgD1.75, como ATCC 40855, en la American Type Culture Collection, Rockville, MD, 20852, EE.UU. 45 50 El gen para US7 del MDV (gI del MDV) ha sido depositado en un plásmido (phagemid) pKSMDgI1.59, como ATCC 75040, en la American Type Culture Collection, Rockville, MD, 20852, EE.UU. El gen para US8 del MDV (gE del MDV) ha sido depositado en un plásmido p18-MDgE2.53, como ATCC 75039, en la American Type Culture Collection, Rockville, MD, 20852, EE.UU. Se adjuntan los Listados de Secuencia para las Secuencias ID Nos 1, 2 y 3 según se describieron previamente en la solicitud. 55 60 16 ES 2 110 999 T3 APÉNDICE I (1) INFORMACIÓN GENERAL (i) Solicitante: 5 10 Leland F. Velicer, Peter Brunovskis y Paul Coussens (ii) Tı́tulo de la Invención: Segmento de ADN del Herpesvirus de la Enfermedad de Marek que Codifica las Glicoproteı́nas gD, gI y gE (iii) Número de Secuencias: 3 (iv) Dirección para Correspondencia: 15 20 (A) (B) (C) (D) (E) (F) Destinatario: Ian C. McLeod Calle: 2190 Commons Parkway Ciudad: Okemos Estado: Michigan Condado: Ingham Zip: 48864 (v) Forma Legible por Ordenador: (A) Tipo de Medio: 25 30 disco magnético flexible 1.44 Mb 3 1/2” (B) Ordenador: IBM PS2, Modelo 50 (C) Sistema Operativo: MS-DOS 5.0 (D) Programa: PC-Write 3.02 (viii) Información sobre el Apoderado/Agente: (A) Nombre: Ian C. McLeod (B) Número de Registro: 20.931 (C) Número de Referencia/Expediente: MSU 4.1-132 35 (ix) Información para Telecomunicación: (A) Teléfono: (517) 347-4100 (B) Telefax: (517) 347-4103 40 (2) Información para la SEC ID N◦ : 1 (i) Caracterı́sticas de la Secuencia: 45 (A) (B) (C) (D) Longitud: 10.350 pares de bases Tipo: ácido nucleico Tipo de Hebra: doble Topologı́a: lineal (ii) Tipo de Molécula: ADN genómico 50 (iii) HIPOTÉTICA: Si (v) ANTISENTIDO: No (vi) FUENTE ORIGINAL: 55 (A) Organismo: MDV, cepa GA (vii) FUENTE INMEDIATA: (A) Biblioteca: gemómica 60 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID N◦ :1: 17 ES 2 110 999 T3 5 10 15 20 25 30 35 40 45 50 55 60 GAATTCCTTG AAATTGGAGT GAAATCTTTA GGGAGGGAGG TTTACCATTG TGGAGAATAT ATAGAGCAAG TAGTACATTA GGGGCTGGGT TAAAGACCAA GTAATTTTTG ACCGGATATC ACGTGATGTA AATTCTAGCA ATTATTGTTC CTAGCAGAAG ATAAAAGCTG GTAGCTATAT AATACAGGCC AAAGTCTCCA AATTACACTT GAGCAGAAAA CCTGCTTTCG GCTCCATCGG AGGCAAC ATG AGT CGT GAT CGA GAT CGA GCC AGA CCC GAT ACA CGA TTA Met Ser Arg Asp Arg Asp Arg Ala Arg Pro Asp Thr Arg Leu 1 5 10 TCA TCG TCA GAT AAT GAG AGC GAC GAC GAA GAT TAT CAA CTG CCA CAT Ser Ser Ser Asp Asn Glu Ser Asp Asp Glu Asp Tyr Gln Leu Pro His 15 20 25 30 TCA CAT CCG GAA TAT GGC AGT GAC TCG TCC GAT CAA GAC TTT GAA CTT Ser His Pro Glu Tyr Gly Ser Asp Ser Ser Asp Gln Asp Phe Glu Leu 35 40 45 AAT AAT GTG GGC AAA TTT TGT CCT CTA CCA TGG AAA CCC GAT GTC GCT Asn Asn Val Gly Lys Phe Cys Pro Leu Pro Trp Lys Pro Asp Val Ala 50 55 60 CGG TTA TGT GCG GAT ACA AAC AAA CTA TTT CGA TGT TTT ATT CGA TGT Arg Leu Cys Ala Asp Thr Asn Lys Leu Phe Arg Cys Phe Ile Arg Cys 65 70 75 CGA CTA AAT AGC GGT CCG TTC CAC GAT GCT CTT CGG AGA GCA CTA TTC Arg Leu Asn Ser Gly Pro Phe His Asp Ala Leu Arg Arg Ala Leu Phe 80 85 90 GAT ATT CAT ATG ATT GGT CGA ATG GGA TAT CGA CTA AAA CAA GCC GAA Asp Ile His Met Ile Gly Arg Met Gly Tyr Arg Leu Lys Gln Ala Glu 95 100 105 110 TGG GAA ACT ATC ATG AAT TTG ACC CCA CGC CAA AGT CTA CAT CTG CGC Trp Glu Thr Ile Met Asn Leu Thr Pro Arg Gln Ser Leu His Leu Arg 115 120 125 AGG ACT CTG AGG GAT GCT GAT AGT CGA AGC GCC CAT CCT ATA TCC GAT Arg Thr Leu Arg Asp Ala Asp Ser Arg Ser Ala His Pro Ile Ser Asp 130 135 140 ATA TAT GCC TCC GAT AGC ATT TTT CAC CCA ATC GCT GCG TCC TCG GGA Ile Tyr Ala Ser Asp Ser Ile Phe His Pro Ile Ala Ala Ser Ser Gly 145 150 155 ACT ATT TCT TCA GAC TGC GAT GTA AAA GGA ATG AAC GAT TTG TCG GTA Thr Ile Ser Ser Asp Cys Asp Val Lys Gly Met Asn Asp Leu Ser Val 160 165 170 GAC AGT AAA TTG CAT TAA CTATCCAGAC TTGAAGAGAA AGCTCTTATT Asp Ser Lys Leu His Fin 175 ATATAATTTT AATTGTTAGA CATAGAGCCG ACATTCTTTG ATCTATCTAA TGAGATAAAA TAATAGATTT TGGATTTATT TGTCATGATC TGTTGCAACA AACGCTGACC CCCCCCATCC ATGAAGGGGC GTGTCAAATA ACGTGTTGCC TTTTTGTTGT ATATGAAGAT ATTTAATGTG GCGTTGAGCC TAATGAGAGG AGAACGTGTT TGAATACTGG AGACGAGCGC CGTGTAAGAT TAAAACATAT TGGAGAGGT ATG GCC ATG TGG TCT CTA CGG CGC AAA TCT Met Ala Met Trp Ser Leu Arg Arg Lys Ser 1 5 10 AGC AGG AGT GTG CAA CTC CGG GTA GAT TCT CCA AAA GAA CAG AGT TAT Ser Arg Ser Val Gln Leu Arg Val Asp Ser Pro Lys Glu Gln Ser Tyr 15 20 25 GAT ATA CTT TCT GCC GGC GGG GAA CAT GTT GCG CTA TTG CCT AAA TCT Asp Ile Leu Ser Ala Gly Gly Glu His Val Ala Leu Leu Pro Lys Ser 30 35 40 GTA CGC AGT CTA GCC AGG ACC ATA TTA ACC GCC GCT ACG ATC TCC CAG Val Arg Ser Leu Ala Arg Thr Ile Leu Thr Ala Ala Thr Ile Ser Gln 45 50 55 GCT GCT ATG AAA GCT GGA AAA CCA CCA TCG TCT CGT TTG TGG GGT GAG Ala Ala Met Lys Ala Gly Lys Pro Pro Ser Ser Arg Leu Trp Gly Glu 60 65 70 ATA TTC GAC AGA ATG ACT GTC ACG CTT AAC GAA TAT GAT ATT TCT GCT 18 60 120 180 240 289 337 385 433 481 529 577 625 673 721 769 817 877 937 997 1057 1106 1154 1202 1250 1298 1346 ES 2 110 999 T3 5 10 15 20 25 30 35 40 45 50 55 60 Ile Phe Asp Arg Met Thr Val Thr Leu Asn Glu 75 80 85 TCG CCA TTC CAC CCG ACA GAC CCG ACG AGA AAA Ser Pro Phe His Pro Thr Asp Pro Thr Arg Lys 95 100 TTA CGG TGT ATT GAA CGT GCT CCT CTT ACA CAC Leu Arg Cys Ile Glu Arg Ala Pro Leu Thr His 110 115 CGG TTT ACT ATC ATG ATG TAT TGG TGT TGT CTT Arg Phe Thr Ile Met Met Tyr Trp Cys Cys Leu 125 130 TGT ACT GTT TCG CGC TTA TAT GAG AAG AAT GTC Cys Thr Val Ser Arg Leu Tyr Glu Lys Asn Val 140 145 GTA GGT TCG GCA ACG GGC TGT GGA ATA AGT CCA Val Gly Ser Ala Thr Gly Cys Gly Ile Ser Pro 155 160 165 TCT TAT TGG AAA CCT TTA TGT CGT GCC GTC GCT Ser Tyr Trp Lys Pro Leu Cys Arg Ala Val Ala 175 180 GCA ATC GGT GAT GAT GCT GAA TTG GCA CAT TAT Ala Ile Gly Asp Asp Ala Glu Leu Ala His Tyr 190 195 GAA TCG CCA ACA GGA GAC GGG GAA TCC TAC TTA Glu Ser Pro Thr Gly Asp Gly Glu Ser Tyr Leu 205 210 AATTATTAAT AGGATTTTAG GAAAAACTGC TACTAACGTT TTTTCAATAA GGCATTACAG TGTTGTCATG ATTGTATGTA GATTACTTCG ATTGAAACTT TGTCTAAATG TCTGTAGGAT ATCGAGGCGG ACGTAAATGG AGATTGCGGC AAATGTAGGG CAACATCCAT TCGACTCATC GGCCTGCGTC CAAATGGATA TTATGACATT AGAAGATCGA TGGTGAATAG TGGGATCTAT TGCATGATAT GCAATGTTCC CGGTTAGGTT TGATAAGATC ACTCCTCTTC AGAAGAATCA TTTATTTTAT GTCCACTGTC TCAATCGATT CGCTTGCATT TGCGTGCAGC ATGTCTTGAT CCGGCAGGCC TAAGGGTGTT CTATACTCGC ACACAGGTAG GAGCTACCTC TATTGCCCCG CTAAGGACAT TTCTTGCAGA TTCGTGTATT GTGTCGATCA TAACCCTTGT TGATTCCTAT TTTCCAGATG AAATGAAAAC AATGCGGGCA AAAATGGTCC CATCTCTCAC ATCCCAAGTT CTATAGAATA TTCTCCACTG TTTCTGTAAA ATTTGTGATA GTTTCAATCG AAAACATTTT TATAGGCAGA CCAGATAACC ATTTGACACC ACATATCCTT TAGATCCCTC GTTAGTAGAT ATGGTACATA AAAGGCCTAA ATTGAACGAT TCCTTCTGTG AATTCATCAA CAACCACATG TCTTTCTCGG TGGCTTACCA AATCGTCCTC TTGGTATATC CATTGACTCT GCTCATCGTT GTCTTTCAAA TGCGCTCGAT TAGAAGTATA TGGAAGATAG CCTGGATACA TAAGTGATCT TAATATACAA ATTATACGTG ACACTATAGC GACGGTTGTA GTGTATACGC CCCATCATGT AATTATATCT AATTGGTAGC AGCTAATGAC TACCGGCTCT ACATTTTTTC TGTATTCGTG CGAACCGGAA TTGCAATCGC ATCTCTATCT TCTTTCTTGC AATCTGCCGG GTGTACTACT CATTTGAGGT GGTTCGATTT GGTGGGGACC CGAGGATTTT GTATACACAT ACCATATCAC TCTTCTGGGG TGTCGAACTT CGGTTCCCAT GTAGATGTCA GGAATGGCCC ACGGCATACC GGACCAGGTC CCAGACACTT GGCAAAGGAA TACATTCGAG CGCAATGGCA CATATATCTG CTATGTGGAG CATTACCAGA AACTTCAGAT TCCAACATCA TGCCATTCTG TGGAACATCC TGCAACATCT TCAAATAGCC GTTCCGGCCA ATCCGGTACC ACGAACTCCA GTTCCATCTG GGTCGATGTT GCCGAGGAAG AATTAACATG GGTTTGGCAA Tyr Asp Ile Ser Ala 90 ATT GTA GGC CGG GCT Ile Val Gly Arg Ala 105 GAA GAA ATG GAC ACT Glu Glu Met Asp Thr 120 GGA CAT GCT GGA TAC Gly His Ala Gly Tyr 135 CGT CTT ATG GAC ATA Arg Leu Met Asp Ile 150 CTC CCC GAA ATA GAG Leu Pro Glu Ile Glu 170 ACT AAG GGG AAT GCA Thr Lys Gly Asn Ala 185 CTG ACA AAT CTT CGG Leu Thr Asn Leu Arg 200 TAA CTAATCGCAC Fin GTTTAAATAA TTATATGGGG TTTACTATTC GTGCTGGTAC TGTTGATGTA ATCCATGCTA ATGTATGGTT CTTGGATATT GGCATTTCCT AGCAAGAACC CTGTATTGTC GGAAAGCATT CACCTGTTTC ACCAGTTTCG GTCCATCATG GTGTATATCA TCTCTCTCGG CCAAAAATTT CATATCATCG TGTTGAATCT AGAAGGGTTT GCGATGCACC AAGTAGGTCT ACTTTCCTGT AACATTTTCC CCGGAGGTTT TGTCGCAAAA AGAGAGTTTG TGATTGCAAG CCGCCCCAAC AATATCCAGA GCACTATAAA GTGGCTTTGT AACGGAATAG 19 TAAAATTTTA TATGCATGAG ATTAGTCTGG ATAAGACCTC CCTTGTAAAG TTCTCAATAT CTATAATACA CCAGTTTCTG ATGCTATCAT ACGGCATATC ATGAACATAT GTGGTCCAGT ATCTTCAATG GTAAGATCAG GCAAAAAATC AACGATGTAA GCTTCCATAC ACATTAGTAA AACATTGTAG CTCCTGATGT GTTATTGCAC TAATCGTAAT GTCGAATAAC CGCAGTGTAA ACAACAGAAT TAGAGGATTG ATGCGCTCTA AATATTGTCG TAACCTTTTT TATCCACAAG TAGAACATCC CGAATCCCTA CCTTACTATC GTCTGCAGCT 1394 1442 1490 1538 1586 1634 1682 1728 1788 1848 1908 1968 2028 2088 2148 2208 2268 2328 2388 2448 2508 2568 2628 2688 2748 2808 2868 2928 2988 3048 3108 3168 3228 3288 3348 3408 3468 3528 3588 3648 3708 3768 ES 2 110 999 T3 5 10 15 20 25 30 35 40 45 50 55 60 CTGGCGATTA AATATCCATA AGAAGTGTGA TATTGTTAAT AGGGTTAAAA TGGGCACACC AAGTAGATGC CTATAGTTAT AACTGGGCCG CTAGGTAATA GAA TGT GGC ATT TCT Glu Cys Gly Ile Ser 5 ACC TAC GGA ATT ATA Thr Tyr Gly Ile Ile 20 TTT GAT ACT TTT CCC Phe Asp Thr Phe Pro 35 GTG GAC GAT GTG AAG Val Asp Asp Val Lys 50 TTG TCA CCT TTT GGG Leu Ser Pro Phe Gly 70 GAC ATT GAT GCA GTT Asp Ile Asp Ala Val 85 TCG TTA CCG CCC GGA Ser Leu Pro Pro Gly 100 GGG GAT AAT ACC AAG Gly Asp Asn Thr Lys 115 AAA ACC CTT GGG AGT Lys Thr Leu Gly Ser 130 TCC ATA ATT AGA TTA Ser Ile Ile Arg Leu 150 ATG GTA ATG CCT AAA Met Val Met Pro Lys 165 ATG GGA CCA TTG CCA Met Gly Pro Leu Pro 180 CTT GGA GCA TTG GCA Leu Gly Ala Leu Ala 195 GTA AAA ACT GAA AAT Val Lys Thr Glu Asn 210 GGG GAC TTT GGG GCA Gly Asp Phe Gly Ala 230 AAA TGT TAT GGA TGG Lys Cys Tyr Gly Trp 245 CTT GCA CTT GAT CCA Leu Ala Leu Asp Pro 260 TTA GTT CTG TTT GAG Leu Val Leu Phe Glu 275 CACATCATCC AGCATCTCTA CATGGACACA GTCTGATCTC GACTGGATGT TGTATTTGTT GATCTTCCTG CCCATCTTCA CAAATCTTAT CTTCGACTCC TCG TCG AAA GTA CAC Ser Ser Lys Val His 10 CAT AAC AGC ATC AAT His Asn Ser Ile Asn 25 GAC AGT ACC GAT AAC Asp Ser Thr Asp Asn 40 ACT GAG AGC TCT CCC Thr Glu Ser Ser Pro 55 AAC GAT GGA AAT GAA Asn Asp Gly Asn Glu 75 TCA GCT GTG CGA ATG Ser Ala Val Arg Met 90 TCT GAA GGG TAT ATC Ser Glu Gly Tyr Ile 105 AGA AAA GTC ATT GTG Arg Lys Val Ile Val 120 GAA ATT GAT ATA TTA Glu Ile Asp Ile Leu 135 GTT CAT GCT TAT AGA Val His Ala Tyr Arg 155 TAC AAA TGC GAC TTG Tyr Lys Cys Asp Leu 170 CTA AAT CAA ATA ATT Leu Asn Gln Ile Ile 185 TAT ATC CAC GAA AAG Tyr Ile His Glu Lys 200 ATA TTT TTG GAT AAA Ile Phe Leu Asp Lys 215 GCA TGT AAA TTA GAT Ala Cys Lys Leu Asp 235 AGT GGA ACT CTG GAA Ser Gly Thr Leu Glu 250 TAC TGT ACA AAA ACT Tyr Cys Thr Lys Thr 265 ATG TCA GTA AAA AAT Met Ser Val Lys Asn 280 CCATACATTG GCAATCGATC CCTCCACCAA ACTCTGGTAG GGAGGCAGAA GAC TCT AAA Asp Ser Lys GGT ACG GAT Gly Thr Asp 30 GCG GAA GTG Ala Glu Val 45 GAG TCC CAA Glu Ser Gln 60 TCC CCC GAA Ser Pro Glu CAG TAT AAC Gln Tyr Asn TAT GTT TGT Tyr Val Cys 110 AAA GCT GTG Lys Ala Val 125 AAA AAA ATG Lys Lys Met 140 TGG AAA TCG Trp Lys Ser TTT ACG TAC Phe Thr Tyr ACG ATA GAA Thr Ile Glu 190 GGT ATA ATA Gly Ile Ile 205 CCT GAA AAT Pro Glu Asn 220 GAA CAT ACA Glu His Thr ACC AAT TCG Thr Asn Ser CTTTATAAGG GCATTCATCT TAATCTTTTT AATATGAAAC ACG ATG Met 1 ACT AAT ACT Thr Asn Thr 15 ACG ACG TTG Thr Thr Leu 4112 4160 ACG GGG GAT Thr Gly Asp 4208 TCT GAA GAT Ser Glu Asp 65 ACG GTG ACG Thr Val Thr 80 ATT GTT TCA Ile Val Ser 95 ACA AAG CGT Thr Lys Arg 4256 ACT GGT GGC Thr Gly Gly 4448 TCT CAC CGC Ser His Arg 145 ACA GTT TGT Thr Val Cys 160 ATA GAT ATC Ile Asp Ile 175 CGG GGT TTG Arg Gly Leu 4496 CAT CGT GAT His Arg Asp 4688 GTA GTA TTG Val Val Leu 225 GAT AAA CCC Asp Lys Pro 240 CCT GAA CTG Pro Glu Leu 255 AGT GCA GGA Ser Ala Gly 4736 GAT ATA TGG Asp Ile Trp 270 ATA ACC TTT TTT GGC AAA Ile Thr Phe Phe Gly Lys 285 20 3828 3888 3948 4008 4064 4304 4352 4400 4544 4592 4640 4784 4832 4880 4928 ES 2 110 999 T3 5 10 15 20 25 30 35 40 45 50 55 60 CAA Gln 290 CAA Gln GTA AAC GGC TCA GGT TCT CAG CTG AGA TCC ATA ATT AGA TGC CTG Val Asn Gly Ser Gly Ser Gln Leu Arg Ser Ile Ile Arg Cys Leu 295 300 305 GTC CAT CCG TTG GAA TTT CCA CAG AAC AAT TCT ACA AAC TTA TGC Val His Pro Leu Glu Phe Pro Gln Asn Asn Ser Thr Asn Leu Cys 310 315 320 AAA CAC TTC AAG CAG TAC GCG ATT CAG TTA CGA CAT CCA TAT GCA ATC Leu His Phe Lys Gln Tyr Ala Ile Gln Leu Arg His Pro Tyr Ala Ile 325 330 335 CCT CAG ATT ATA CGA AAG AGT GGT ATG ACG ATG GAT CTT GAA TAT GCT Pro Gln Ile Ile Arg Lys Ser Gly Met Thr Met Asp Leu Glu Tyr Ala 340 345 350 ATT GCA AAA ATG CTC ACA TTC GAT CAG GAG TTT AGA CCA TCT GCC CAA Ile Ala Lys Met Leu Thr Phe Asp Gln Glu Phe Arg Pro Ser Ala Gln 355 360 365 GAT ATT TTA ATG TTG CCT CTT TTT ACT AAA GAA CCC GCT GAC GCA TTA Asp Ile Leu Met Leu Pro Leu Phe Thr Lys Glu Pro Ala Asp Ala Leu 370 375 380 385 TAC ACG ATA ACT GCC GCT CAT ATG TAA ACACCCGTCA AAAATAACTT Tyr Thr Ile Thr Ala Ala His Met Fin 390 CAATGATTCA TTTTATAATA TATACTACGC GTTACCTGCA ATAATGACAA CATTCGAAGT CTTTGAAGAT TCGCAGACCT TTTTTGCGA ATG GCA CCT TCG GGA CCT ACG CCA Met Ala Pro Ser Gly Pro Thr Pro 1 5 TAT TCC CAC AGA CCG CAA ATA AAG CAT TAT GGA ACA TTT TCG GAT TGC Tyr Ser His Arg Pro Gln Ile Lys His Tyr Gly Thr Phe Ser Asp Cys 10 15 20 ATG AGA TAT ACT CTA AAC GAT GAG AGT AAG GTA GAT GAT AGA TGT TCA Met Arg Tyr Thr Leu Asn Asp Glu Ser Lys Val Asp Asp Arg Cys Ser 25 30 35 40 GAC ATA CAT AAC TCC TTA GCA CAA TCC AAT GTT ACT TCA AGC ATG TCT Asp Ile His Asn Ser Leu Ala Gln Ser Asn Val Thr Ser Ser Met Ser 45 50 55 GTA ATG AAC GAT TCG GAA GAA TGT CCA TTA ATA AAT GGA CCT TCG ATG Val Met Asn Asp Ser Glu Glu Cys Pro Leu Ile Asn Gly Pro Ser Met 60 65 70 CAG GCA GAG GAC CCT AAA AGT GTT TTT TAT AAA GTT CGT AAG CCT GAC Gln Ala Glu Asp Pro Lys Ser Val Phe Tyr Lys Val Arg Lys Pro Asp 75 80 85 CGA AGT CGT GAT TTT TCA TGG CAA AAT CTG AAC TCC CAT GGC AAT AGT Arg Ser Arg Asp Phe Ser Trp Gln Asn Leu Asn Ser His Gly Asn Ser 90 95 100 GGT CTA CGT CGT GAA AAA TAT ATA CGT TCC TCT AAG AGG CGA TGG AAG Gly Leu Arg Arg Glu Lys Tyr Ile Arg Ser Ser Lys Arg Arg Trp Lys 105 110 115 120 AAT CCC GAG ATA TTT AAG GTA TCT TTG AAA TGT GAA TCA ATT GGC GCT Asn Pro Glu Ile Phe Lys Val Ser Leu Lys Cys Glu Ser Ile Gly Ala 125 130 135 GGT AAC GGA ATA AAA ATT TCA TTC TCA TTT TTC TAA CATTATAATA Gly Asn Gly Ile Lys Ile Ser Phe Ser Phe Phe Fin 140 145 TATCAGATCG TTTCTTATAT ACTTATTTTC ATCGTCGGGA TATGACTAAC GTATACTAAG TTACAAGAAA CAACTGCTTA ACGTCGAACA TAACGGAAAT AAAAATATAT ATAGCGTCTC CTATAACTGT TATATTGGCA CCTTTTAGAG CTTCGGT ATG AAT AGA TAC AGA TAT Met Asn Arg Tyr Arg Tyr -30 -25 GAA AGT ATT TTT TTT AGA TAT ATC TCA TCC ACG AGA ATG ATT CTT ATA Glu Ser Ile Phe Phe Arg Tyr Ile Ser Ser Thr Arg Met Ile Leu Ile -20 -15 -10 ATC TGT TTA CTT TTG GGA ACT GGG GAC ATG TCC GCA ATG GGA CTT AAG 21 4976 5024 5072 5120 5168 5216 5263 5323 5376 5424 5472 5520 5568 5616 5664 5712 5760 5806 5866 5926 5981 6029 6077 ES 2 110 999 T3 5 10 15 20 25 30 35 40 45 50 55 60 Ile Cys Leu Leu -5 AAA GAC AAT TCT Lys Asp Asn Ser 10 AAC CTC CGG GCT Asn Leu Arg Ala 25 GAT ACA CTT GAC Asp Thr Leu Asp AAT TGT AGT TTT Asn Cys Ser Phe 60 CTT CTC AGT TTA Leu Leu Ser Leu 75 GCA TGG TTT GTC Ala Trp Phe Val 90 GAA TAT GCC AAC Glu Tyr Ala Asn 105 AAG TCC CTA GGA Lys Ser Leu Gly GAT CGA GAT GAA Asp Arg Asp Glu 140 AGT GGA TTA TAT Ser Gly Leu Tyr 155 AGT GAC ATA TTA Ser Asp Ile Leu 170 GGG ATA AAG GAT Gly Ile Lys Asp 185 GGT ACA ACA CGG Gly Thr Thr Arg CAT GAA GAA AAT His Glu Glu Asn 220 CTA CCA ATC GTC Leu Pro Ile Val 235 AGA AGT TTT AGA Arg Ser Phe Arg 250 AAT GAC GTC AAA Asn Asp Val Lys 265 GTG GAT GGT TAC Val Asp Gly Tyr GCA CCA TAC ATA Ala Pro Tyr Ile 300 AGT CAA TCA CCT Ser Gln Ser Pro 315 Leu Gly Thr Gly Asp 1 CCG ATC ATT CCC ACA Pro Ile Ile Pro Thr 15 ACT CTC AAT GAA TAC Thr Leu Asn Glu Tyr 30 AAT TCA TAT GAG ACA Asn Ser Tyr Glu Thr 45 GCT GTT TTG AAT CCA Ala Val Leu Asn Pro 65 CTG TTG ATG GGA CGA Leu Leu Met Gly Arg 80 TTG GGC AGA GCA TGT Leu Gly Arg Ala Cys 95 TGC TCT ACT AAT GAA Cys Ser Thr Asn Glu 110 TGG TGG GAT AGA AGA Trp Trp Asp Arg Arg 125 TTG AAA TTG ATT ATT Leu Lys Leu Ile Ile 145 ACG CGT TTA ATA ATT Thr Arg Leu Ile Ile 160 CTG ACT GTT AAA GGA Leu Thr Val Lys Gly 175 AAC AAA CTA TGC AAA Asn Lys Leu Cys Lys 190 CTG TTA GAC ATG GTG Leu Leu Asp Met Val 205 GTG AAG CAG TGG CTT Val Lys Gln Trp Leu 225 GTC GAA ACA TCT ATG Val Glu Thr Ser Met 240 GAT TCA TAT TTA AAA Asp Ser Tyr Leu Lys 255 ATG ACA TCG GCC ACT Met Thr Ser Ala Thr 270 ACT GGA CTC ACT AAT Thr Gly Leu Thr Asn 285 ACT AAA CGA CCG ATA Thr Lys Arg Pro Ile 305 AAA ATA TCA ACA GAA Lys Ile Ser Thr Glu 320 Met Ser Ala Met 5 TTA CAT CCG AAA Leu His Pro Lys 20 AAA ATC CCG TCT Lys Ile Pro Ser 35 AAA CAC GTA ATA Lys His Val Ile 50 TTT GGC GAT CCG Phe Gly Asp Pro CGC AAA Arg Lys GGG AGA Gly Arg CCA TTT Pro Phe 115 TAT GCA Tyr Ala 130 GCA GCA Ala Ala ATT AAT Ile Asn ACA TGT Thr Cys CCG TTC Pro Phe 195 CGA ACA Arg Thr 210 GAA CGA Glu Arg CAA CAA Gln Gln TCA CCT Ser Pro ACT AAT Thr Asn 275 CGG CCC Arg Pro 290 ATC TCT Ile Ser AAA AAA Lys Lys Gly Leu Lys GGT AAT GAA Gly Asn Glu 6125 CCA CTG TTT Pro Leu Phe 40 TAT ACG GAT Tyr Thr Asp 55 AAA TAT ACG Lys Tyr Thr 70 TAT GAT GCT CTA GTA Tyr Asp Ala Leu Val 85 CCA ATT TAT TTA CGT Pro Ile Tyr Leu Arg 100 GGA ACT TGT AAA TTA Gly Thr Cys Lys Leu 120 ATG ACG AGT TAT ATC Met Thr Ser Tyr Ile 135 CCC AGT CGT GAG CTA Pro Ser Arg Glu Leu 150 GGA GAA CCC ATT TCG Gly Glu Pro Ile Ser 165 AGT TTT TCG AGA CGG Ser Phe Ser Arg Arg 180 AGT TTT TTT GTC AAT Ser Phe Phe Val Asn 200 GGA ACC CCG AGA GCC Gly Thr Pro Arg Ala 215 AAT GGT GGT AAA CAT Asn Gly Gly Lys His 230 GTC TCA AAT TTG CCG Val Ser Asn Leu Pro 245 GAC GAC GAT AAA TAT Asp Asp Asp Lys Tyr 260 AAC ATT ACC ACC TCC Asn Ile Thr Thr Ser 280 GAG GAC TTT GAG AAA Glu Asp Phe Glu Lys 295 GTC GAG GAG GCA TCC Val Glu Glu Ala Ser 310 TCC CGA ACG CAA ATA Ser Arg Thr Gln Ile 325 6173 22 6221 6269 6317 6365 6413 6461 6509 6557 6605 6653 6701 6749 6797 6845 6893 6941 6989 7037 ES 2 110 999 T3 5 10 15 20 ATA ATT TCA Ile Ile Ser 330 GGG TCT GGT Gly Ser Gly 345 GAT AGA CGT Asp Arg Arg CTA GTT GTT CTA TGC GTC ATG TTT Leu Val Val Leu Cys Val Met Phe 335 ATA TGG ATC CTT CGC AAA CAC CGC Ile Trp Ile Leu Arg Lys His Arg 350 355 CGT CCA TCA AGA CGG GCA TAT TCC Arg Pro Ser Arg Arg Ala Tyr Ser 365 370 CACGTGTTTG GTATGGGCGT GTCGCTATAG TGCATAAGAA ACATTATATA GCTTCTTTGG TCAGATAGAC GGCGTGTGTG CTA Leu -15 GTT Val GTT Val TTA Leu 25 GAA Glu 50 GCG Ala 30 GGC Gly 35 CCT Pro TCA Ser 40 ATG Met 130 TGG Trp 45 CGC Arg 50 GGC Gly ACT Thr 55 TAC Tyr 210 AAT Asn 60 ACC CAA TTA TTA TTT TGG Gln Leu Leu Phe Trp -10 TAT ACT GGA ACA TCT Tyr Thr Gly Thr Ser 5 GCG TTC CGC GGA TTA Ala Phe Arg Gly Leu 20 TTC CTG GGC GAC CAG Phe Leu Gly Asp Gln 35 ATC TTG AAA TGG GAT Ile Leu Lys Trp Asp 55 ACA TCA TAT ATG GAT Thr Ser Tyr Met Asp 70 TGT AGA GAC GCT GTG Cys Arg Asp Ala Val 85 TTT CCC GAA AAG GGA Phe Pro Glu Lys Gly 100 GAT ACA GGC AGC TAT Asp Thr Gly Ser Tyr 115 AGC GAT ATA TTT AGA Ser Asp Ile Phe Arg 135 GCC TGT AAT CAC TCT Ala Cys Asn His Ser 150 TAT GTC GAC CGT ATG Tyr Val Asp Arg Met 165 AAT TTG CTG GAC AGT Asn Leu Leu Asp Ser 180 CCC CAA TCC ATT TCC Pro Gln Ser Ile Ser 195 GAT AAT TCG GGA ACA Asp Asn Ser Gly Thr 215 AAC AAT TCC CAT GTC Asn Asn Ser His Val 230 GTT TTA AAA TAT ACC ATC CGC CTC TTT CGA Ile Arg Leu Phe Arg -5 GTT ACG TTA TCA ACG Val Thr Leu Ser Thr 10 GAT AAA ATG GTG AAT Asp Lys Met Val Asn 25 ACT CGG ACC AGT TCT Thr Arg Thr Ser Ser 40 GAA GAA TAT AAA TGC Glu Glu Tyr Lys Cys 60 TGT CCT GCT ATA GAC Cys Pro Ala Ile Asp 75 GTA TAT GCT CAA CCT Val Tyr Ala Gln Pro 90 ACA TTG TTG AGA ATT Thr Leu Leu Arg Ile 105 TAC ATA CGT GTA TCT Tyr Ile Arg Val Ser 120 ATG GTT GTT ATT ATA Met Val Val Ile Ile 140 GCT AGT TCA TTT CAG Ala Ser Ser Phe Gln 155 GCC TTT GAA AAT TAT Ala Phe Glu Asn Tyr 170 GAC TCG GAA TTG CAT Asp Ser Glu Leu His 185 ACA GAT ATT AAT ATT Thr Asp Ile Asn Ile 200 ATT TAT TCA CCT ACG Ile Tyr Ser Pro Thr 220 GAT GCA ATG AAT TCG Asp Ala Met Asn Ser 235 CTT CCA AGG CTT ATT TGT Cys 340 AAA Lys TTC ATT GTA ATC Phe Ile Val Ile 7085 ACG GTG ATG TAT Thr Val Met Tyr 360 CGC CTA TAA Arg Leu Fin 7133 GTTGACTACA TTGATCAATG ATTGCG ATG TAT GTA Met Tyr Val GGC ATC TGG TCT ATA Gly Ile Trp Ser Ile 1 GAC CAA TCT GCT CTT Asp Gln Ser Ala Leu 15 GTA CGC GGC CAA CTT Val Arg Gly Gln Leu 30 TAT ACA GGA ACG ACG Tyr Thr Gly Thr Thr 45 TAT TCC GTT CTA CAT Tyr Ser Val Leu His 65 GCC ACG GTA TTC AGA Ala Thr Val Phe Arg 80 CAT GGT AGA GTA CAA His Gly Arg Val Gln 95 GTC GAA CCC AGA GTA Val Glu Pro Arg Val 110 CTC GCT GGA AGA AAT Leu Ala Gly Arg Asn 125 AGG AGT AGC AAA TCT Arg Ser Ser Lys Ser 145 GCC CAT AAA TGT ATT Ala His Lys Cys Ile 160 CTG ATT GGA CAT GTA Leu Ile Gly His Val 175 GCA ATT TAT AAT ATT Ala Ile Tyr Asn Ile 190 GTA ACG ACT CCA TTT Val Thr Thr Pro Phe 205 GTT TTT AAT TTG TTT Val Phe Asn Leu Phe 225 ACT GGT ATG TGG AAT Thr Gly Met Trp Asn 240 TAC TTT TCT ACG ATG 23 7175 7235 7290 7338 7386 7434 7482 7530 7578 7626 7674 7722 7770 7818 7866 7914 7962 8010 8058 8106 ES 2 110 999 T3 5 10 15 20 25 30 35 40 45 50 55 60 Thr Val Leu Lys 245 ATT GTA CTA TGT Ile Val Leu Cys 260 TGC CGC TCT CCC Cys Arg Ser Pro 275 GAG GCC CCA CTC Glu Ala Pro Leu 290 TAT AAT GTA AAG Tyr Asn Val Lys Tyr Thr Leu Pro Arg Leu Ile Tyr Phe Ser Thr Met 250 255 ATA ATA GCA TTG GCA ATT TAT TTG GTC TGT GAA AGG Ile Ile Ala Leu Ala Ile Tyr Leu Val Cys Glu Arg 265 270 CAT CGT AGG ATA TAC ATC GGT GAA CCA AGA TCT GAT His Arg Arg Ile Tyr Ile Gly Glu Pro Arg Ser Asp 280 285 ATC ACT TCT GCA GTT AAC GAA TCA TTT CAA TAT GAT Ile Thr Ser Ala Val Asn Glu Ser Phe Gln Tyr Asp 295 300 305 GAA ACT CCT TCA GAT GTT ATT GAA AAG GAG TTG ATG Glu Thr Pro Ser Asp Val Ile Glu Lys Glu Leu Met 310 315 320 GAA AAA CTG AAG AAG AAA GTC GAA TTG TTG GAA AGA GAA GAA TGT GTA Glu Lys Leu Lys Lys Lys Val Glu Leu Leu Glu Arg Glu Glu Cys Val 325 330 335 TAG GTTTGAGAAA CTATTATAGG TAGGTGGTAC CTGTTAGCTT AGTATAAGGG Fin GAGGAGCCGT TTCTTGTTTT AAAGACACGA ACACAAGGCC GTAAGTTTTA TATGTGAATT TTGTGCATGT CTGCGAGTCA GCGTCATA ATG TGT GTT TTC CAA ATC CTG ATA Met Cys Val Phe Gln Ile Leu Ile -15 ATA GTG ACG ACG ATC AAA GTA GCT GGA ACG GCC AAC ATA AAT CAT ATA Ile Val Thr Thr Ile Lys Val Ala Gly Thr Ala Asn Ile Asn His Ile -10 -5 1 5 GAC GTT CCT GCA GGA CAT TCT GCT ACA ACG ACG ATC CCG CGA TAT CCA Asp Val Pro Ala Gly His Ser Ala Thr Thr Thr Ile Pro Arg Tyr Pro 10 15 20 CCA GTT GTC GAT GGG ACC CTT TAC ACC GAG ACG TGG ACA TGG ATT CCC Pro Val Val Asp Gly Thr Leu Tyr Thr Glu Thr Trp Thr Trp Ile Pro 25 30 35 AAT CAC TGC AAC GAA ACG GCA ACA GGC TAT GTA TGT CTG GAA AGT GCT Asn His Cys Asn Glu Thr Ala Thr Gly Tyr Val Cys Leu Glu Ser Ala 40 45 50 CAC TGT TTT ACC GAT TTG ATA TTA GGA GTA TCC TGC ATG AGG TAT GCG His Cys Phe Thr Asp Leu Ile Leu Gly Val Ser Cys Met Arg Tyr Ala 55 60 65 70 GAT GAA ATC GTC TTA CGA ACT GAT AAA TTT ATT GTC GAT GCG GGA TCC Asp Glu Ile Val Leu Arg Thr Asp Lys Phe Ile Val Asp Ala Gly Ser 75 80 85 ATT AAA CAA ATA GAA TCG CTA AGT CTG AAT GGA GTT CCG AAT ATA TTC Ile Lys Gln Ile Glu Ser Leu Ser Leu Asn Gly Val Pro Asn Ile Phe 90 95 100 CTA TCT ACG AAA GCA AGT AAC AAG TTG GAG ATA CTA AAT GCT AGC CTA Leu Ser Thr Lys Ala Ser Asn Lys Leu Glu Ile Leu Asn Ala Ser Leu 105 110 115 CAA AAT GCG GGT ATC TAC ATT CGG TAT TCT AGA AAT GGG ACG AGG ACT Gln Asn Ala Gly Ile Tyr Ile Arg Tyr Ser Arg Asn Gly Thr Arg Thr 120 125 130 GCA AAG CTG GAT GTT GTT GTG GTT GGC GTT TTG GGT CAA GCA AGG GAT Ala Lys Leu Asp Val Val Val Val Gly Val Leu Gly Gln Ala Arg Asp 135 140 145 150 CGC CTA CCC CAA ATG TCC AGT CCT ATG ATC TCA TCC CAC GCC GAT ATC Arg Leu Pro Gln Met Ser Ser Pro Met Ile Ser Ser His Ala Asp Ile 155 160 165 AAG TTG TCA TTA AAA AAC TTT AAA GCA TTA GTA TAT CAC GTG GGA GAT Lys Leu Ser Leu Lys Asn Phe Lys Ala Leu Val Tyr His Val Gly Asp 170 175 180 ACT ATC AAT GTC TCG ACG GCG GTT ATA CTA GGA CCT TCT CCG GAG ATA 24 8154 8202 8250 8298 8346 8399 8459 8511 8559 8607 8655 8703 8751 8799 8847 8895 8943 8991 9039 9087 9135 ES 2 110 999 T3 5 10 15 20 25 30 35 40 45 50 55 60 Thr Ile Asn 185 TTC ACA TTG Phe Thr Leu 200 AAG TTC GTC Lys Phe Val 215 GAG TGT ATT Glu Cys Ile Val Ser Thr Ala Val Ile Leu Gly Pro Ser Pro Glu Ile 190 195 GAA TTT AGG GTG TTG TTC CTC CGT TAT AAT CCA ACG TGC Glu Phe Arg Val Leu Phe Leu Arg Tyr Asn Pro Thr Cys 205 210 ACG ATT TAT GAA CCT TGT ATA TTT CAC CCC AAA GAA CCA Thr Ile Tyr Glu Pro Cys Ile Phe His Pro Lys Glu Pro 220 225 230 ACT ACT GCA GAA CAA TCG GTA TGT CAT TTC GCA TCC AAC Thr Thr Ala Glu Gln Ser Val Cys His Phe Ala Ser Asn 235 240 245 ATT GAC ATT CTG CAG ATA GCC GCC GCA CGT TCT GAA AAT TGT AGC ACA Ile Asp Ile Leu Gln Ile Ala Ala Ala Arg Ser Glu Asn Cys Ser Thr 250 255 260 GGG TAT CGT AGA TGT ATT TAT GAC ACG GCT ATC GAT GAA TCT GTG CAG Gly Tyr Arg Arg Cys Ile Tyr Asp Thr Ala Ile Asp Glu Ser Val Gln 265 270 275 GCC AGA TTA ACA TTC ATA GAA CCA GGA ATT CCT TCC TTT AAA ATG AAA Ala Arg Leu Thr Phe Ile Glu Pro Gly Ile Pro Ser Phe Lys Met Lys 280 285 290 GAT GTC CAG GTA GAC GAT GCT GGA TTG TAT GTG GTT GTG GCT TTA TAC Asp Val Gln Val Asp Asp Ala Gly Leu Tyr Val Val Val Ala Leu Tyr 295 300 305 310 AAT GGA CGT CCA AGT GCA TGG ACT TAC ATT TAT TTG TCA ACG GTG GAA Asn Gly Arg Pro Ser Ala Trp Thr Tyr Ile Tyr Leu Ser Thr Val Glu 315 320 325 ACA TAT CTT AAT GTA TAT GAA AAC TAC CAC AAG CCG GGA TTT GGG TAT Thr Tyr Leu Asn Val Tyr Glu Asn Tyr His Lys Pro Gly Phe Gly Tyr 330 335 340 AAA TCA TTT CTA CAG AAC AGT AGT ATC GTC GAC GAA AAT GAG GCT AGC Lys Ser Phe Leu Gln Asn Ser Ser Ile Val Asp Glu Asn Glu Ala Ser 345 350 355 GAT TGG TCC AGC TCG TCC ATT AAA CGG AGA AAT AAT GGT ACT ATC ATT Asp Trp Ser Ser Ser Ser Ile Lys Arg Arg Asn Asn Gly Thr Ile Ile 360 365 370 TAT GAT ATT TTA CTC ACA TCG CTA TCA ATT GGG GCG ATT ATT ATC GTC Tyr Asp Ile Leu Leu Thr Ser Leu Ser Ile Gly Ala Ile Ile Ile Val 375 380 385 390 ATA GTA GGG GGT GTT TGT ATT GCC ATA TTA ATT AGG CGT AGG AGA CGA Ile Val Gly Gly Val Cys Ile Ala Ile Leu Ile Arg Arg Arg Arg Arg 395 400 405 CGT CGC ACG AGG GGG TTA TTC GAT GAA TAT CCC AAA TAT ATG ACG CTA Arg Arg Thr Arg Gly Leu Phe Asp Glu Tyr Pro Lys Tyr Met Thr Leu 410 415 420 CCA GGA AAC GAT CTG GGG GGC ATG AAT GTA CCG TAT GAT AAT ACA TGC Pro Gly Asn Asp Leu Gly Gly Met Asn Val Pro Tyr Asp Asn Thr Cys 425 430 435 TCT GGT AAC CAA GTT GAA TAT TAT CAA GAA AAG TCG GCT AAA ATG AAA Ser Gly Asn Gln Val Glu Tyr Tyr Gln Glu Lys Ser Ala Lys Met Lys 440 445 450 AGA ATG GGT TCG GGT TAT ACC GCT TGG CTA AAA AAT GAT ATG CCG AAA Arg Met Gly Ser Gly Tyr Thr Ala Trp Leu Lys Asn Asp Met Pro Lys 455 460 465 470 ATT AGG AAA CGC TTA GAT TTA TAC CAC TGA TATGTACATA TTTAAACTTA Ile Arg Lys Arg Leu Asp Leu Tyr His Fin 475 ATGGGATATA GTATATGGAC GTCTATATGA CGAGAGTAAA TAAACTGACA ATGCAAATGA AGCTGATCTA TATTGTGCTT TATATTGGGA CAAACCACTC GCACAAGCTC ATTCAACACA TCCACTCTTG CTATTAAATT CCCCATTATA TAACAATACT GACATAACAC TCATATTAAG GGGAGAAAAT AAATATGCAT GGCCGATCAT ATTTTATTGA GATCCGAAAA TATATCATGC AAATAAGCAT GTTCTAGCAC CACTGCAACA TGTGGTTTAT CGATTTCCGG AAAGAATAGT TGAACCATTG CCTCCGAGCA GTTGGCGATC CGTTGACCTG CAGGTCGAC 25 9183 9231 9279 9327 9375 9423 9471 9519 9567 9615 9663 9711 9759 9807 9855 9903 9951 10001 10061 10121 10181 10241 10301 10350 ES 2 110 999 T3 (3) Información para la SEC ID N◦ : 2 5 10 15 20 25 30 35 40 45 50 55 60 (i) Caracterı́sticas de la Secuencia: (A) Longitud: 10.350 pares de bases (B) Tipo: ácido nucleico (C) Tipo de hebra: doble (D) Topologı́a: lineal (ii) Tipo de Molécula: (A) Descripción: ADN genómico (iii) HIPOTÉTICA: Si (iv) ANTISENTIDO: Si (vi) FUENTE ORIGINAL: (A) Organismo: MDV, cepa GA (vii) FUENTE INMEDIATA: (A) Biblioteca: genómica (xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID N◦ :2: GTCGACCTGC CGGAAATCGA TTTCGGATCT TGTTATGTCA AGCTTGTGCG GTCAGTTTAT ATGTACATAT CCAAGCGGTA AACTTGGTTA TGGTAGCGTC ACGCCTAATT TGATAGCGAT CGAGCTGGAC TTTATACCCA TGACAAATAA CAATCCAGCA GAATGTTAAT CCCTGTGCTA GAAATGACAT ACAAGGTTCA AAATTCCAAT AGTATCTCCC GTGGGATGAG GCCAACCACA GATACCCGCA TAGGAATATA ATCGACAATA TCCTAATATC TTCGTTGCAG TGGTGGATAT TATGTTGGCC CATTATGACG TTCGTGTCTT ACCTATAATA CTTCAGTTTT ATCATATTGA TTCACCGATG CAATGCTATT TTTTAAAACG AAACAAATTA AGGTCAACGG TAAACCACAT CAATAAAATA GTATTGTTAT AGTGGTTTGT TTACTCTCGT CAGTGGTATA TAACCCGAAC CCAGAGCATG ATATATTTGG AATATGGCAA GTGAGTAAAA CAATCGCTAG AATCCCGGCT ATGTAAGTCC TCGTCTACCT CTGGCCTGCA CAATTTTCAG ACCGATTGTT TAAATCGTGA GTGAATATCT ACGTGATATA ATCATAGGAC ACAACATCCA TTTTGTAGGC TTCGGAACTC AATTTATCAG AAATCGGTAA TGATTGGGAA CGCGGGATCG GTTCCAGCTA CTGACTCGCA TAAAACAAGA GTTTCTCAAA TCCATCAACT AATGATTCGT TATATCCTAC ATACATAGTA GTATTCCACA AAAACCGTAG ATCGCCAACT GTTGCAGTGG TGATCGGCCA ATAATGGGGA CCCAATATAA CATATAGACG AATCTAAGCG CCATTCTTTT TATTATCATA GATATTCATC TACAAACACC TATCATAAAT CCTCATTTTC TGTGGTAGTT ATGCACTTGG GGACATCTTT CAGATTCATC AACGTGCGGC CTGCAGTAGT CGAACTTGCA CCGGAGAAGG CTAATGCTTT TGGACATTTG GCTTTGCAGT TAGCATTTAG CATTCAGACT TTCGTAAGAC AACAGTGAGC TCCATGTCCA TCGTTGTAGC CTTTGATCGT GACATGCACA AACGGCTCCT CCTATACACA CCTTTTCAAT TAACTGCAGA GATGGGGAGA CAATCATCGT TACCAGTCGA GTGAATAAAT GCTCGGAGGC TGCTAGAACA TGCATATTTA ATTTAATAGC AGCACAATAT TCCATATACT TTTCCTAATT CATTTTAGCC CGGTACATTC GAATAACCCC CCCTACTATG GATAGTACCA GTCGACGATA TTCATATACA ACGTCCATTG CATTTTAAAG GATAGCCGTG GGCTATCTGC AATACACTCT CGTTGGATTA TCCTAGTATA AAAGTTTTTT GGGTAGGCGA CCTCGTCCCA TATCTCCAAC TAGCGATTCT GATTTCATCC ACTTTCCAGA CGTCTCGGTG AGAATGTCCT CGTCACTATT AAATTCACAT CCCCTTATAC TTCTTCTCTT AACATCTGAA AGTGATGAGT GCGGCACCTT AGAAAAGTAA ATTCATTGCA TGTTCCCGAA AATGGTTCAA TGCTTATTTG TTTTCTCCCC AAGAGTGGAT AGATCAGCTT ATATCCCATT TTCGGCATAT GACTTTTCTT ATGCCCCCCA CTCGTGCGAC ACGATAATAA TTATTTCTCC CTACTGTTCT TTAAGATATG TATAAAGCCA GAAGGAATTC TCATAAATAC AGAATGTCAA GGTTCTTTGG TAACGGAGGA ACCGCCGTCG AATGACAACT TCCCTTGCTT TTTCTAGAAT TTGTTACTTG ATTTGTTTAA GCATACCTCA CATACATAGC TAAAGGGTCC GCAGGAACGT ATCAGGATTT ATAAAACTTA TAAGCTAACA TCCAACAATT GGAGTTTCCT GGGGCCTCAT TCACAGACCA ATAAGCCTTG TCGACATGGG TTATCGTAAA 26 CTATTCTTTC CATGATATAT TTAATATGAG GTGTTGAATG CATTTGCATT AAGTTTAAAT CATTTTTTAG GATAATATTC GATCGTTTCC GTCGTCTCCT TCGCCCCAAT GTTTAATGGA GTAGAAATGA TTTCCACCGT CAACCACATA CTGGTTCTAT ATCTACGATA TGTTGGATGC GGTGAAATAT ACAACACCCT AGACATTGAT TGATATCGGC GACCCAAAAC ACCGAATGTA CTTTCGTAGA TGGATCCCGC TGCAGGATAC CTGTTGCCGT CATCGACAAC CTATATGATT GGAAAACACA CGGCCTTGTG GGTACCACCT CGACTTTCTT TTACATTATA CAGATCTTGG AATAAATTGC GAAGGGTATA AATTGTTATT ATGGAGTCGT 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 ES 2 110 999 T3 5 10 15 20 25 30 35 40 45 50 55 60 TACAATATTA CGAGTCACTG GTCGACATAG AGATTTGCTA GAGAGATACA CAATGTTCCC GTCTCTACAG ATGTAGAACG ATAAGAACTG TTTATCTAAT TCCAGTATAA TACATACATC ATCAATGTAG GGCGGGAATA TGCGAAGGAT CTAGTGAAAT TGGATGCCTC CCTCGGGCCG TGGCCGATGT CTCTAAAACT GATGTTTACC TTCCTGTTCG TGCATAGTTT GTAATATGTC TTAGCTCACG TCATTGCATA CATTAGTAGA AGACAAACCA GCGTATATTT TTACGTGTTT ATTCATTGAG GAGAATTGTC TTATAAGAAT TATTCATACC TTTTATTTCC CATATCCCGA AAATGAGAAT CTTAAATATC TAGACCACTA CTTACGAACT TAATGGACAT TAAGGAGTTA TCTCATGCAA AGGTCCCGAA TCATTATTGC CGGGTGTTTA AAAGAGGCAA TTTTTGCAAT TTGCATATGG AATTGTTCTG GAGAACCTGA ACAGAACTAA GTTCAGGCGA GTTCATCTAA AAAATATATT ATGCTCCAAG TATCTATGTA TCCATCTATA CAATTTCACT TATTATCCCC AAACAATGTT ATATCTGTGG TCCAGCAAAT CGAATACATT CTCCTTATAA CGTATGTAAT TTTTCGGGAA CCTCTGAATA GAATAGCATT GTCCGAGTCT CCGCGGAACG ACTATAGACC GCAATCACAC TCAACTTCTT TGCCCGTCTT CCATATACCA TATTATTTGC CTCGACAGAG ATTAGTGAGT CATTTTGACG TCTCGGCAAA ACCATTTCGT CACCATGTCT GTTATCCTTT ACTCGAAATG ACTGGGTGCT TCTTCTATCC GCAGTTGGCA TGCTACTAGA CGGATCGCCA TGTCTCATAT AGTAGCCCGG TTTCTTAAGT CATTCTCGTG GAAGCTCTAA GTTATGTTCG CGATGAAAAT GAAATTTTTA TCGGGATTCT TTGCCATGGG TTATAAAAAA TCTTCCGAAT TGTATGTCTG TCCGAAAATG GGTGCCATTC AGGTAACGCG CATATGAGCG CATTAAAATA AGCATATTCA ATGTCGTAAC TGGAAATTCC GCCGTTTACT TCCTGCACTC ATTGGTTTCC TTTACATGCT TTCAGTTTTT CAAACCCCGT CGTAAACAAG AGCATGAACT CCCAAGGGTT ACGCTTTGTA ATACTGCATT AAATGGATTG TGCCTACATG TATGGGCCTG TAACAACCAT AGCTGCCTGT AAGGTTGTAC CCGTGGCGTC TATATTCTTC GGTCGCCCAG CAACAAGAGC AGATGCCTCG ACGCCGTCTA ATGCACTATA GATGGACGAC GACCCGATTA GTTCGGGATT ATTATCGGTC CCAGTGTAAC TCATTATATT TTTGAGACTT TCAAGCCACT AACAGCCGTG ATCCCCCGTC GGTTCTCCAT GCAATAATCA CACCATCCTA TATTCACGTA GCATCATATT AATGGATTCA GAATTGTCAA AGGTTTTCAT CCCATTGCGG GATGAGATAT AAGGTGCCAA ACGTTAAGCA AAGTATATAA TTCCGTTACC TCCATCGCCT AGTTCAGATT CACTTTTAGG CGTTCATTAC AACATCTATC TTCCATAATG GCAAAAAAGG TAGTATATAT GCAGTTATCG TCTTGGGCAG AGATCCATCG TGAATCGCGT AACGGATGGA TGTTTGCCAA CATATATCAG AGAGTTCCAC GCCCCAAAGT ACATCACGAT TCTATCGTAA TCGCATTTGT AATCTAATTA TTGCCACCAG CAAACATAGA CGCACAGCTG GGGAGTAATA TCCAATCAGA AAATGAACTA TCTAAATATA ATCTGATACT TCTACCATGA TATAGCAGGA ATCCCATTTC GAATAAAAGT AGATTGGTCC AAAGAGGCGG TCTGACCAAA GCGACACGCC GTCTATCATA CAATGAAACA TTTTTTCTGT GTTTAGTTAT CATCCACGGA TATCGTCGTC GTTGCATAGA GCTTCACATT TTGTACCATT TCGAAAAACT TAATAATTAT ATTTCAATTC GGGACTTTAA AATAAATTGG TGCGTCGTCC AAACAGCAAA GTGTATCAAA TACCTTTCGG ACATGTCCCC ATCTAAAAAA TATAACAGTT GTTGTTTCTT GAAACGATCT AGCGCCAATT CTTAGAGGAA TTGCCATGAA GTCCTCTGCC AGACATGCTT ATCTACCTTA CTTTATTTGC TCTGCGAATC TATAAAATGA TGTATAATGC ATGGTCTAAA TCATACCACT ACTGCTTGAA CTTGCAGGCA AAAAGGTTAT TTTTTGTACA TCCATCCATA CCCCCAATAC GTATTATACC TTATTTGATT ATTTAGGCAT TGGAGCGGTG TCACAGCTTT TATACCCTTC AAACTGCATC TTATAAATTG TAATTTTCAA GCAGAGTGAT TCGCTCATAT CTGGGTTCGA GGTTGAGCAT CAATCCATAT AAGATTTCCG TGGCCGCGTA GTTGATAACG ATCCAAAATA GAAGCTATAT CATACCAAAC CATCACCGTT AAACATGACG TGATATTTTA GTATGGTGCT GGTGGTAATG AGGTGATTTT TGTTTCGACG TTCTTCATGG GACAAAAAAA ACATGTTCCT TAAACGCGTA ATCTCGATCG TTTACAAGTT TCTCCCACAT CATCAACAGT ACTACAATTA CAGTGGAGAC ATGTAATGTG AGTTCCCAAA AATACTTTCA ATAGGAGACG GTAACTTAGT GATATATTAT GATTCACATT CGTATATATT AAATCACGAC TGCATCGAAG GAAGTAACAT CTCTCATCGT GGTCTGTGGG TTCAAAGACT ATCATTGAAG GTCAGCGGGT CTCCTGATCG CTTTCGTATA GTGTTTGCAT TCTAATTATG ATTTTTTACT GTATGGATCA ACATTTGGGT TACATTTTCA CTTTTCGTGG TAGTGGCAAT TACCATACAA AGACATTTTT CACAATGACT AGATCCGGGC AATGTCCGTC 27 CATGCAATTC AGGCCATACG TACAGGCCCA TTCTTCCAGC CAATTCTCAA ATACCACAGC ATGATGTCGC TCGTTCCTGT CATTCACCAT TAACAGATGT ATAATTGTAG AATGTCATTG ACGTGTTATA TTGCGGTGTT CATAGAACAA GGTGATTGAC TTCTCAAAGT TTATTAGTAG AAATATGAAT ACGATTGGTA GCTCTCGGGG CTGAACGGTT TTAACAGTCA TATAATCCAC ATATAACTCG CCAAATGGTT GCTCTGCCCA AAACTGAGAA TCCGTATATA GGGATTTTGT GGAATGATCG AGTAAACAGA TATCTGTATC CTATATATAT ATACGTTAGT AATGTTAGAA TCAAAGATAC TTTCACGACG TTCGGTCAGG GTCCATTTAT TGGATTGTGC TTAGAGTATA AATATGGCGT TCGAATGTTG TTATTTTTGA TCTTTAGTAA AATGTGAGCA ATCTGAGGGA AAGTTTGTAG GATCTCAGCT GACATCTCAA AGTGCAAGCA TTATCTGTAT GGTTTATCCA ATATATGCCA GGTCCCATGA ACTGTCGATT TTTAATATAT TTTCTCTTGG GGTAACGATG ACCGTTTCGG 2460 2520 2580 2640 2700 2760 2820 2880 2940 3000 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 3720 3780 3840 3900 3960 4020 4080 4140 4200 4260 4320 4380 4440 4500 4560 4620 4680 4740 4800 4860 4920 4980 5040 5100 5160 5220 5280 5340 5400 5460 5520 5580 5640 5700 5760 5820 5880 5940 6000 6060 ES 2 110 999 T3 5 10 15 20 25 30 35 40 45 50 55 60 GGCATTCATT TCCATCGTTC CCAAAAGGTG ACAAATCTTC AGATTGGGAC TCGGGAGAGC TCTCAGTCTT CACATCGTCC ACATCCCCCG TCACTTCCGC GTTATCGGTA CTGTCGGGAA AAGTATCAAA CAACGTCGTA TCCGTACCAT TGATGCTGTT ATGTATAATT CCGTAGGTAG TATTAGTTTT AGAGTCGTGT ACTTTCGACG AAGAAATGCC ACATTCCATC GTTTCTGCCT CCGGAGTCGA AGACATCCAG TCTATTACCT AGTTTTAACC CTGTTTCATA TTCTACCAGA GTATAAGATT TGGAGATCAG ACCGGCCCAG TTATTAACAA TAAAAAAGAT TATTGGTGGA GGTGAAG ATG GGT GTG TCC ATG ATA ACT ATA GTC ACA CTT CTA GAT GAA Met Gly Val Ser Met Ile Thr Ile Val Thr Leu Leu Asp Glu 1 5 10 TGC GAT CGA TTG CCA GGA AGA TCT AGA GAT GCT GCA TCT ACT TTA TGG Cys Asp Arg Leu Pro Gly Arg Ser Arg Asp Ala Ala Ser Thr Leu Trp 15 20 25 30 ATA TTC CTT ATA AAG CAA TGT ATG GAA CAA ATA CAG GAT GAT GTG GGT Ile Phe Leu Ile Lys Gln Cys Met Glu Gln Ile Gln Asp Asp Val Gly 35 40 45 GTG CCC ATA ATC GCC AGA GCT GCA GAC CTA TTC CGT TTT GCC AAA CCC Val Pro Ile Ile Ala Arg Ala Ala Asp Leu Phe Arg Phe Ala Lys Pro 50 55 60 ATG TTA ATT CTT CCT CGG CAA CAT CGA CCG ATA GTA AGG ACA AAG CCA Met Leu Ile Leu Pro Arg Gln His Arg Pro Ile Val Arg Thr Lys Pro 65 70 75 CCA GAT GGA ACT GGA GTT CGT GGT ACC GGA TTG GCC GGA ACT AGG GAT Pro Asp Gly Thr Gly Val Arg Gly Thr Gly Leu Ala Gly Thr Arg Asp 80 85 90 TCG TTT ATA GTG CGG CTA TTT GAA GAT GTT GCA GGA TGT TCC ACA GAA Ser Phe Ile Val Arg Leu Phe Glu Asp Val Ala Gly Cys Ser Thr Glu 95 100 105 110 TGG CAG GAT GTT CTA TCT GGA TAT TTG ATG TTG GAA TCT GAA GTT TCT Trp Gln Asp Val Leu Ser Gly Tyr Leu Met Leu Glu Ser Glu Val Ser 115 120 125 GGT AAT GCT CCA CAT AGC TTG TGG ATA GTT GGG GCG GCA GAT ATA TGT Gly Asn Ala Pro His Ser Leu Trp Ile Val Gly Ala Ala Asp Ile Cys 130 135 140 GCC ATT GCG CTC GAA TGT ATT CCT TTG CCA AAA AGG TTA CTT GCA ATC Ala Ile Ala Leu Glu Cys Ile Pro Leu Pro Lys Arg Leu Leu Ala Ile 145 150 155 AAA GTG TCT GGG ACC TGG TCC GGT ATG CCG TGG GCC ATT CCC GAC AAT Lys Val Ser Gly Thr Trp Ser Gly Met Pro Trp Ala Ile Pro Asp Asn 160 165 170 ATT CAA ACT CTC TTG ACA TCT ACA TGG GAA CCG AAG TTC GAC ACC CCA Ile Gln Thr Leu Leu Thr Ser Thr Trp Glu Pro Lys Phe Asp Thr Pro 175 180 185 190 GAA GAT AGA GCG CAT TTT TGC GAC AGT GAT ATG GTA TGT GTA TAC AAA Glu Asp Arg Ala His Phe Cys Asp Ser Asp Met Val Cys Val Tyr Lys 195 200 205 ATC CTC GGG TCC CCA CCC AAT CCT CTA AAA CCT CCG GAA ATC GAA CCA Ile Leu Gly Ser Pro Pro Asn Pro Leu Lys Pro Pro Glu Ile Glu Pro 210 215 220 CCT CAA ATG AGT AGT ACA CCC GGC AGA TTA TTC TGT TGT GGA AAA TGT Pro Gln Met Ser Ser Thr Pro Gly Arg Leu Phe Cys Cys Gly Lys Cys 225 230 235 TGC AAG AAA GAA GAT AGA GAT GCG ATT GCA ATT CCG GTT CGT TAC ACT Cys Lys Lys Glu Asp Arg Asp Ala Ile Ala Ile Pro Val Arg Tyr Thr 240 245 250 GCG ACA GGA AAG TCA CGA ATA CAG AAA AAA TGT AGA GCC GGT AGT CAT Ala Thr Gly Lys Ser Arg Ile Gln Lys Lys Cys Arg Ala Gly Ser His 255 260 265 270 TAG CTGTTATTCG ACAGACCTAC TTGCTACCAA TTAGATATAA TTACATGATG Fin GGGCGTATAC ACATTACGAT TAGGTGCATC GCTACAACCG TCGCTATAGT GTCACGTATA ATTTGTATAT TAGTGCAATA ACAAACCCTT CTAGATCACT TATGTATCCA GGCTATCTTC CATATACTTC TAACATCAGG AGAGATTCAA CAATCGAGCG CATTTGAAAG ACAACG ATG 28 6120 6180 6240 6300 6360 6420 6469 6517 6565 6613 6661 6709 6757 6805 6853 6901 6949 6997 7045 7093 7141 7189 7237 7290 7350 7410 7469 ES 2 110 999 T3 5 10 15 20 25 30 35 40 45 50 55 60 AGC AGA GTC AAT GCT Ser Arg Val Asn Ala 5 CGA TTT GGT AAG CCA Arg Phe Gly Lys Pro 20 GTG GTT GTT GAT GAA Val Val Val Asp Glu 35 CGA GAG AGA TTA GGC Arg Glu Arg Leu Gly 50 ATT ACA TCG TTT GAT Ile Thr Ser Phe Asp 70 TGG TCT GCC TAT AGA Trp Ser Ala Tyr Arg 85 GAA ACT ATC ACA AAT Glu Thr Ile Thr Asn 100 TGG AGA ATA TTC TAT Trp Arg Ile Phe Tyr 115 AAA CAG GTG GGA CCA Lys Gln Val Gly Pro 130 AAC TGG ACC ACA ATG Asn Trp Thr Thr Met 150 CAC AAT ACA CGA AAT His Asn Thr Arg Asn 165 CTT AGC GGG GCA ATA Leu Ser Gly Ala Ile 180 CCT GTG TGC GAG TAT Pro Val Cys Glu Tyr 195 GGA AAT GCC ATC AAG Gly Asn Ala Ile Lys 210 ACA GAA ACT GGA ATA Thr Glu Thr Gly Ile 230 TCT GAA GAG GAG TTG Ser Glu Glu Glu Leu 245 AAC CGG GAA CAT TGC Asn Arg Glu His Cys 260 GAT CCC ACT ATT CAC Asp Pro Thr Ile His 275 ACA TCA ACA TAT CCA Thr Ser Thr Tyr Pro 290 GGA GGT CTT ATG TAC Gly Gly Leu Met Tyr 310 ACA ATG TTC GAT GAT Thr Met Phe Asp Asp 10 CCG AGA AAG ATT ACT Pro Arg Lys Ile Thr 25 TTC ACA GAA GGA ATC Phe Thr Glu Gly Ile 40 CTT TTA TGT ACC ATA Leu Leu Cys Thr Ile 55 ATA CAC AAG GAT ATG Ile His Lys Asp Met 75 TTT TTT GCC ATG ATG Phe Phe Ala Met Met 90 TTT ACA GAA ACT GAT Phe Thr Glu Thr Asp 105 AGA ACT TGG GAT GTG Arg Thr Trp Asp Val 120 TTT TTG CCC GCA TTG Phe Leu Pro Ala Leu 135 CTT TCC ATA GGA ATC Leu Ser Ile Gly Ile 155 ATG TTC ATG ACA ATA Met Phe Met Thr Ile 170 GAG GTA GCT CGA TAT Glu Val Ala Arg Tyr 185 AGA ACA CCC TTA GGC Arg Thr Pro Leu Gly 200 ACA TGC TGC ACG CAA Thr Cys Cys Thr Gln 215 TCC AAG GAC AGT GGA Ser Lys Asp Ser Gly 235 TAT TAT AGA ACC ATA Tyr Tyr Arg Thr Ile 250 ATA TCA TGC AAT ATT Ile Ser Cys Asn Ile 265 CAT CGA TCT TCT AAT His Arg Ser Ser Asn 280 TTT GGA CGC AGG CCG Phe Gly Arg Arg Pro 295 CAG CAC CCC TAC ATT Gln His Pro Tyr Ile 315 ATG GAT ATA Met Asp Ile AAT GTA AAT Asn Val Asn 30 GTT CAA TGT Val Gln Cys 45 TCT ACT AAC Ser Thr Asn 60 TGG TGT CAA Trp Cys Gln GAC AAA ATG Asp Lys Met CTT ACC GAA Leu Thr Glu 110 AGA GAT GCA Arg Asp Ala 125 TTT TCA TTT Phe Ser Phe 140 AAC AAG GGT Asn Lys Gly CAG TCT GCA Gln Ser Ala GCC GTG GTT Ala Val Val 190 CTG CCG GAT Leu Pro Asp 205 ATG CAA GCG Met Gln Ala 220 CAT AAA ATA His Lys Ile CAT GAT CTT His Asp Leu GAG AAT AGC Glu Asn Ser 270 GTC ATA ACT Val Ile Thr 285 ATG AGT CGA Met Ser Arg 300 TGC CGC AAT Cys Arg Asn 29 Met 1 CCA AGA GGA Pro Arg Gly 15 TTT TGG CAT Phe Trp His 7517 7565 ATG GAA GCC Met Glu Ala 7613 GAG GGA TCT Glu Gly Ser 65 ATG GTT ATC Met Val Ile 80 TTT TCG ATT Phe Ser Ile 95 ACT GGT CAG Thr Gly Gln 7661 TTG AAG ATG Leu Lys Met 7853 CAT CTG GAA His Leu Glu 145 TAT GAT CGA Tyr Asp Arg 160 AGA AAT GTC Arg Asn Val 175 CTT GCT CTA Leu Ala Leu 7901 GAT AGC ATA Asp Ser Ile 8093 AAT CGA TTG Asn Arg Leu 225 AAT GAT TCT Asn Asp Ser 240 ATC AAA CCT Ile Lys Pro 255 ATG GAT ATA Met Asp Ile 8141 TTA CAA GGT Leu Gln Gly 8333 ATG GAT GTT Met Asp Val 305 CTC CAT TTA Leu His Leu 320 8381 7709 7757 7805 7949 7997 8045 8189 8237 8285 8429 ES 2 110 999 T3 5 10 15 20 25 30 35 CGT CCG CCT CGA TCC AGA CTA ATG AAT AGT AAA Arg Pro Pro Arg Ser Arg Leu Met Asn Ser Lys 325 330 AGA CAA AGT TTC AAT CGA AGT AAT CCT CAT GCA Arg Gln Ser Phe Asn Arg Ser Asn Pro His Ala 340 345 TACATACAAT CATGACAACA CTGTAATGCC TTATTGAAAA AACGTTAGTA GCAGTTTTTC CTAAAATCCT ATTAATAATT GATTCCCCGT CTCCTGTTGG CGATTCCCGA AGATTTGTCA TCATCACCGA TTGCTGCATT CCCCTTAGTA GCGACGGCAC GACTCTATTT CGGGGAGTGG ACTTATTCCA CAGCCCGTTG AGACGGACAT TCTTCTCATA TAAGCGCGAA ACAGTACAGT CACCAATACA TCATGATAGT AAACCGAGTG TCCATTTCTT TCAATACACC GTAAAGCCCG GCCTACAATT TTTCTCGTCG GAAGCAGAAA TATCATATTC GTTAAGCGTG ACAGTCATTC AAACGAGACG ATGGTGGTTT TCCAGCTTTC ATAGCAGCCT AATATGGTCC TGGCTAGACT GCGTACAGAT TTAGGCAATA GCAGAAAGTA TATCATAACT CTGTTCTTTT GGAGAATCTA CTAGATTTGC GCCGTAGAGA CCACATGGCC ATACCTCTCC GGCGCTCGTC TCCAGTATTC AAACACGTTC TCCTCTCATT TATCTTCATA TACAACAAAA AGGCAACACG TTATTTGACA GGGTCAGCGT TTGTTGCAAC AGATCATGAC AAATAAATCC ATTAGATAGA TCAAAGAATG TCGGCTCTAT GTCTAACAAT TTTCTCTTCA AGTCTGGATA GTTAATGCAA TTTACTGTCT TTTTACATCG CAGTCTGAAG AAATAGTTCC CGAGGACGCA ATCGGAGGCA TATATATCGG ATATAGGATG GGCGCTTCGA CCTGCGCAGA TGTAGACTTT GGCGTGGGGT CAAATTCATG TTTTAGTCGA TATCCCATTC GACCAATCAT ATGAATATCG ATCGTGGAAC GGACCGCTAT TTAGTCGACA TCGAATAAAA ATCCGCACAT AACCGAGCGA CATCGGGTTT CCATGGTAGA ATTAAGTTCA AAGTCTTGAT CGGACGAGTC ACTGCCATAT TTGATAATCT TCGTCGTCGC TCTCATTATC TGACGATGAT TCGATCTCGA TCACGACTCA TGTTGCCTCC GATGGAGCCG GTGTAATTTG GAGACTTTGG CCTGTATTAT ATAGCTACCA ACAATAATTG CTAGAATTTA CATCACGTGA TATCCGGTCA CCAGCCCCTA ATGTACTACT TGCTCTATAT ATTCTCCACA AAGATTTCAC TCCAATTTCA AGGAATTC ATC CTA CAG ACA TTT Ile Leu Gln Thr Phe 335 TAC CCC ATA TAA Tyr Pro Ile Fin 350 TAAAATTTTA TTATTTAAAC GTGCGATTAG TTATAAGTAG GATAATGTGC CAATTCAGCA GACATAAAGG TTTCCAATAA CCGAACCTAC TATGTCCATA ATCCAGCATG TCCAAGACAA CGTGTGTAAG AGGAGCACGT GGTCTGTCGG GTGGAATGGC TGTCGAATAT CTCACCCCAC GGGAGATCGT AGCGGCGGTT GCGCAACATG TTCCCCGCCG CCCGGAGTTG CACACTCCTG AATATGTTTT AATCTTACAC AGGCTCAACG CCACATTAAA CGCCCCTTCA TGGATGGGGG AAAATCTATT ATTTTATCTC TAAAATTATA TAATAAGAGC ACCGACAAAT CGTTCATTCC GCGATTGGGT GAAAAATGCT CTATCAGCAT CCCTCAGAGT ATAGTTTCCC ATTCGGCTTG AATAGTGCTC TCCGAAGAGC CATCGAAATA GTTTGTTTGT GGACAAAATT TGCCCACATT TCCGGATGTG AATGTGGCAG AATCGTGTAT CGGGTCTGGC AAAGCAGGTT TTCTGCTCAA GCTTTTATCT TCTGCTAGGA AAAATTACTT GGTCTTTAAC ATGGTAAACC TCCCTCCCTA (4) Información para la SEC ID N◦ : 3 40 45 (i) Caracterı́sticas de la Secuencia: (A) (B) (C) (D) Longitud: 497 aminoácidos Tipo: péptido Tipo de Hebra: sencilla Topologı́a: lineal (ii) Tipo de Molécula: (A) Descripción: polipéptido 50 (iv) FUENTE ORIGINAL: (A) Organismo: MDV, cepa GA (vii) FUENTE INMEDIATA: 55 (A) Biblioteca: genómica (xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID N◦ :3: 60 Met Cys Val Phe Gln Ile Leu Ile Ile Val Thr Thr Ile Lys Val Ala -15 -10 -5 Gly Thr Ala Asn Ile Asn His Ile Asp Val Pro Ala Gly His Ser Ala 1 5 10 30 8477 8522 8582 8642 8702 8762 8822 8882 8942 9002 9062 9122 9182 9242 9302 9362 9422 9482 9542 9602 9662 9722 9782 9842 9902 9962 10022 10082 10142 10202 10262 10322 10350 ES 2 110 999 T3 5 10 15 20 25 30 35 40 45 50 55 Thr Thr Thr Ile Pro 15 Thr Glu Thr Trp Thr 35 Gly Tyr Val Cys Leu 50 Gly Val Ser Cys Met 65 Lys Phe Ile Val Asp 80 Leu Asn Gly Val Pro 95 Leu Glu Ile Leu Asn 115 Tyr Ser Arg Asn Gly 130 Gly Val Leu Gly Gln 145 Met Ile Ser Ser His 160 Ala Leu Val Tyr His 175 Ile Leu Gly Pro Ser 195 Phe Leu Arg Tyr Asn 210 Cys Ile Phe His Pro 225 Ser Val Cys His Phe 240 Ala Arg Ser Glu Asn 255 Thr Ala Ile Asp Glu 275 Gly Ile Pro Ser Phe 290 Leu Tyr Val Val Val 305 Tyr Ile Tyr Leu Ser 320 Tyr His Lys Pro Gly 335 Ile Val Asp Glu Asn 355 Arg Arg Asn Asn Gly 370 Ser Ile Gly Ala Ile 385 Ile Leu Ile Arg Arg 400 Glu Tyr Pro Lys Tyr 415 Asn Val Pro Tyr Asp 435 Gln Glu Lys Ser Ala 450 Trp Leu Lys Asn Asp 465 His Fin Arg Tyr Pro Pro Val 20 Trp Ile Pro Asn His 40 Glu Ser Ala His Cys 55 Arg Tyr Ala Asp Glu 70 Ala Gly Ser Ile Lys 85 Asn Ile Phe Leu Ser 100 Ala Ser Leu Gln Asn 120 Thr Arg Thr Ala Lys 135 Ala Arg Asp Arg Leu 150 Ala Asp Ile Lys Leu 165 Val Gly Asp Thr Ile 180 Pro Glu Ile Phe Thr 200 Pro Thr Cys Lys Phe 215 Lys Glu Pro Glu Cys 230 Ala Ser Asn Ile Asp 245 Cys Ser Thr Gly Tyr 260 Ser Val Gln Ala Arg 280 Lys Met Lys Asp Val 295 Ala Leu Tyr Asn Gly 310 Thr Val Glu Thr Tyr 325 Phe Gly Tyr Lys Ser 340 Glu Ala Ser Asp Trp 360 Thr Ile Ile Tyr Asp 375 Ile Ile Val Ile Val 390 Arg Arg Arg Arg Arg 405 Met Thr Leu Pro Gly 420 Asn Thr Cys Ser Gly 440 Lys Met Lys Arg Met 455 Met Pro Lys Ile Arg 470 Val Asp Gly Thr Leu 25 Cys Asn Glu Thr Ala 45 Phe Thr Asp Leu Ile 60 Ile Val Leu Arg Thr 75 Gln Ile Glu Ser Leu 90 Thr Lys Ala Ser Asn 105 Ala Gly Ile Tyr Ile 125 Leu Asp Val Val Val 140 Pro Gln Met Ser Ser 155 Ser Leu Lys Asn Phe 170 Asn Val Ser Thr Ala 185 Leu Glu Phe Arg Val 205 Val Thr Ile Tyr Glu 220 Ile Thr Thr Ala Glu 235 Ile Leu Gln Ile Ala 250 Arg Arg Cys Ile Tyr 265 Leu Thr Phe Ile Glu 285 Gln Val Asp Asp Ala 300 Arg Pro Ser Ala Trp 315 Leu Asn Val Tyr Glu 330 Phe Leu Gln Asn Ser 345 Ser Ser Ser Ser Ile 365 Ile Leu Leu Thr Ser 380 Gly Gly Val Cys Ile 395 Thr Arg Gly Leu Phe 410 Asn Asp Leu Gly Gly 425 Asn Gln Val Glu Tyr 445 Gly Ser Gly Tyr Thr 460 Lys Arg Leu Asp Leu 475 60 31 Tyr 30 Thr Leu Asp Ser Lys 110 Arg Val Pro Lys Val 190 Leu Pro Gln Ala Asp 270 Pro Gly Thr Asn Ser 350 Lys Leu Ala Asp Met 430 Tyr Ala Tyr ES 2 110 999 T3 REIVINDICACIONES 5 1. Un método para preparar un segmento de ADN con un gen que codifica el precursor de la glicoproteı́na E (gE) del MDV proporcionando una secuencia de ADN situada entre los nucleótidos 8488 y 9978 de la secuencia del ADN del herpesvirus de la enfermedad de Marek, identificada como parte de la SEC ID N◦ :1 y conteniendo secuencias promotoras potenciales hasta 400 nucleótidos 5’ del gen ası́ como subfragmentos del ADN, que reconocen selectivamente el ADN cuando está en forma de sonda, de una manera conocida per se. 10 2. El método de acuerdo con la reivindicación 1, en el que la glicoproteı́na codificada contiene 497 aminoácidos. 3. Un método para preparar un precursor de la glicoproteı́na gE, en el que una proteı́na que comprende la secuencia 15 20 25 30 35 40 45 50 55 60 Met Cys Val Phe -15 Gly Thr Ala Asn 1 Thr Thr Thr Ile 15 Thr Glu Thr Trp Gly Tyr Val Cys 50 Gly Val Ser Cys 65 Lys Phe Ile Val 80 Leu Asn Gly Val 95 Leu Glu Ile Leu Tyr Ser Arg Asn 130 Gly Val Leu Gly 145 Met Ile Ser Ser 160 Ala Leu Val Tyr 175 Ile Leu Gly Pro Phe Leu Arg Tyr 210 Cys Ile Phe His 225 Ser Val Cys His 240 Ala Arg Ser Glu 255 Thr Ala Ile Asp Gly Ile Pro Ser 290 Leu Tyr Val Val 305 Tyr Ile Tyr Leu 320 Tyr His Lys Pro 335 Gln Ile Leu Ile Ile -10 Ile Asn His Ile Asp 5 Pro Arg Tyr Pro Pro 20 Thr Trp Ile Pro Asn 35 Leu Glu Ser Ala His 55 Met Arg Tyr Ala Asp 70 Asp Ala Gly Ser Ile 85 Pro Asn Ile Phe Leu 100 Asn Ala Ser Leu Gln 115 Gly Thr Arg Thr Ala 135 Gln Ala Arg Asp Arg 150 His Ala Asp Ile Lys 165 His Val Gly Asp Thr 180 Ser Pro Glu Ile Phe 195 Asn Pro Thr Cys Lys 215 Pro Lys Glu Pro Glu 230 Phe Ala Ser Asn Ile 245 Asn Cys Ser Thr Gly 260 Glu Ser Val Gln Ala 275 Phe Lys Met Lys Asp 295 Val Ala Leu Tyr Asn 310 Ser Thr Val Glu Thr 325 Gly Phe Gly Tyr Lys 340 Val Thr Thr Ile Lys -5 Val Pro Ala Gly His 10 Val Val Asp Gly Thr 25 His Cys Asn Glu Thr 40 Cys Phe Thr Asp Leu 60 Glu Ile Val Leu Arg 75 Lys Gln Ile Glu Ser 90 Ser Thr Lys Ala Ser 105 Asn Ala Gly Ile Tyr 120 Lys Leu Asp Val Val 140 Leu Pro Gln Met Ser 155 Leu Ser Leu Lys Asn 170 Ile Asn Val Ser Thr 185 Thr Leu Glu Phe Arg 200 Phe Val Thr Ile Tyr 220 Cys Ile Thr Thr Ala 235 Asp Ile Leu Gln Ile 250 Tyr Arg Arg Cys Ile 265 Arg Leu Thr Phe Ile 280 Val Gln Val Asp Asp 300 Gly Arg Pro Ser Ala 315 Tyr Leu Asn Val Tyr 330 Ser Phe Leu Gln Asn 345 32 Val Ala Ser Ala Leu Tyr 30 Ala Thr 45 Ile Leu Thr Asp Leu Ser Asn Lys 110 Ile Arg 125 Val Val Ser Pro Phe Lys Ala Val 190 Val Leu 205 Glu Pro Glu Gln Ala Ala Tyr Asp 270 Glu Pro 285 Ala Gly Trp Thr Glu Asn Ser Ser 350 ES 2 110 999 T3 5 10 15 Ile Val Asp Glu Asn 355 Arg Arg Asn Asn Gly 370 Ser Ile Gly Ala Ile 385 Ile Leu Ile Arg Arg 400 Glu Tyr Pro Lys Tyr 415 Asn Val Pro Tyr Asp 435 Gln Glu Lys Ser Ala 450 Trp Leu Lys Asn Asp 465 His Fin Glu Ala Ser Asp Trp 360 Thr Ile Ile Tyr Asp 375 Ile Ile Val Ile Val 390 Arg Arg Arg Arg Arg 405 Met Thr Leu Pro Gly 420 Asn Thr Cys Ser Gly 440 Lys Met Lys Arg Met 455 Met Pro Lys Ile Arg 470 Ser Ser Ser Ser Ile 365 Ile Leu Leu Thr Ser 380 Gly Gly Val Cys Ile 395 Thr Arg Gly Leu Phe 410 Asn Asp Leu Gly Gly 425 Asn Gln Val Glu Tyr 445 Gly Ser Gly Tyr Thr 460 Lys Arg Leu Asp Leu 475 Lys Leu Ala Asp Met 430 Tyr Ala Tyr es preparada de una manera conocida per se por tecnologı́a de ADN recombinante. 20 4. Un método para reducir la patogenicidad o virulencia de un herpesvirus de la enfermedad de Marek por el que se altera un gen que codifica la glicoproteı́na E. 25 30 35 5. Un método para producir un vector vı́rico vacuna, para utilización in vivo, o un vector de expresión in vitro, para una proteı́na que produce anticuerpos contra la enfermedad de Marek, que comprende la etapa de insertar en la vacuna o vector un segmento de ADN que contiene todo o parte de un gen que codifica la glicoproteı́na gE del herpesvirus de la enfermedad de Marek. 6. Un método para proporcionar genes foráneos a un herpesvirus de la enfermedad de Marek, que comprende la inserción del gen foráneo en una región del ADN del herpesvirus que codifica la proteı́na gE no esencial. 7. Un método para preparar un segmento de ADN, en el que el segmento de ADN codifica una parte del precursor de la glicoproteı́na E (gE) del MDV situado entre los nucleótidos 8488 y 8799 de la secuencia de ADN del herpesvirus de la enfermedad de Marek e identificado como parte de la SEC ID N◦ :1, donde el segmento de ADN contiene opcionalmente una región reguladora 5’ con el gen de hasta 400 pb de longitud según se muestra en la Fig. 2, y subfragmentos del ADN que reconocen selectivamente el ADN cuando está en forma de sonda, en el que el segmento de ADN es preparado de una manera conocida per se. 40 8. Un método para preparar un precursor de la glicoproteı́na gE, en el que una proteı́na que comprende la secuencia: 45 50 55 60 Met Cys Val Phe -15 Gly Thr Ala Asn 1 Thr Thr Thr Ile 15 Thr Glu Thr Trp Gly Tyr Val Cys 50 Gly Val Ser Cys 65 Lys Phe Ile Val 80 Gln Ile Leu Ile Ile -10 Ile Asn His Ile Asp 5 Pro Arg Tyr Pro Pro 20 Thr Trp Ile Pro Asn 35 Leu Glu Ser Ala His 55 Met Arg Tyr Ala Asp 70 Asp Ala Gly Ser 85 Val Thr Thr Ile Lys -5 Val Pro Arg Gly His 10 Val Val Asp Gly Thr 25 His Cys Asn Glu Thr 40 Cys Phe Thr Asp Leu 60 Glu Ile Val Leu Arg 75 Val Ala Ser Ala Leu Tyr 30 Ala Thr 45 Ile Leu Thr Asp es preparada de una manera conocida per se. 9. Un método para preparar una región reguladora 5’ para la glicoproteı́na gE, en el que la secuencia situada entre los nucleótidos 8088 y 8487 de la secuencia mostrada en la Fig. 2 es preparada de una 33 ES 2 110 999 T3 manera conocida per se. 5 10. Un método para producir una sonda que tiene especificidad para el ADN del herpesvirus de la enfermedad de Marek, en el que una sonda que reconoce selectivamente el segmento de ADN de la reivindicación 1 es preparada de una manera conocida per se. 10 15 20 25 30 35 40 45 50 55 60 NOTA INFORMATIVA: Conforme a la reserva del art. 167.2 del Convenio de Patentes Europeas (CPE) y a la Disposición Transitoria del RD 2424/1986, de 10 de octubre, relativo a la aplicación del Convenio de Patente Europea, las patentes europeas que designen a España y solicitadas antes del 7-10-1992, no producirán ningún efecto en España en la medida en que confieran protección a productos quı́micos y farmacéuticos como tales. Esta información no prejuzga que la patente esté o no incluı́da en la mencionada reserva. 34