Clonagem de expressão Tópicos Significado da clonagem de expressão Expressão heteróloga em E. coli Tipos de vectores de expressão Expressão heteróloga em Saccharomyces cerevisiae Vectores de clonagem em leveduras Expressão heteróloga em células de mamífero Vectores de clonagem em células de mamífero Significado da clonagem de expressão Muitas das manipulações em clonagem molecular (clonagem geral) não requerem a expressão do DNA clonado. A clonagem de expressão permite obter o produto do gene clonado. O produto é utilizado para diferentes fins: • O transcrito da sequência clonada (transcrição in vitro) pode servir como sonda de hibridação. • A proteína expressa pode servir para identificar o gene clonado, numa biblioteca de expressão, por hibridação com o anticorpo específico. • O DNA recombinante pode servir para produzir proteínas de valor comercial. Expressão heteróloga em E. coli (1) • Objectivo – Produção de grande quantidade de proteína recombinante • Factores de selecção do sistema de expressão • Principais factores da expressão de genes clonados • Expressão em E. coli - Vantagens e desvantagens - Razões da expressão não eficiente - Configuração de vectores eficientes - Regulação transcricional Promotor Terminador - Regulação traducional Iniciação da tradução Estimuladores traducionais Terminação da tradução Expressão heteróloga em E. coli (2) - Promotores - Frequência de utilização de codões - Proteólise - Expressão citoplasmática - Expressão periplasmática - Secreção extracelular - Fusões transcricionais - Fusões traducionais Adição de tags Adição de sinais de secreção (Protein targeting) Factores de selecção do sistema de expressão • Características do crescimento celular • Níveis de expressão (intracelular e/ou extracelular) • Modificações pós-traducionais • Actividade biológica da proteína relevante • Dificuldades, custos Principais factores da expressão de genes clonados Vantagens e desvantagens da expressão em E. coli Vantagens Desvantagens • Vasto conhecimento da genética e fisiologia de E. coli • Não realiza modificações póstraducionais e tem capacidade limitada de formar pontes dissulfídricas • Diversidade de vectores de clonagem • Fácil controlo da expressão génica • Actividade biológica e imunogenicidade podem diferir da proteína natural • Fácil crescimento produções • Elevado endotoxinas com elevadas • Secreção do produto no meio de cultura conteúdo de • Falta de um mecanismo de secreção Razões da expressão não eficiente em E. coli • Características estruturais da sequência de nucleótidos do gene • Instabilidade do mRNA • Reduzida eficiência traducional • Dificuldade de enrolamento da proteína • Diferenças de utilização de codões • Toxicidade da proteína para o hospedeiro Configuração de vectores de expressão eficientes MCS Elevado nº de cópias, elevado nº de moldes de transcrição Características do promotor (P) - Sequências -10, -35 - Elemento UP (sequência a montante da box -35, estimulador da transcrição) - Forte (eficientemente reconhecido pela polimerase de RNA) - Regulação forte (baixo nível de expressão basal devido ao gene regulador, R, presente no vector ou integrado no cromossoma de E. coli) - Indução fácil (térmica ou química) - Posicionamento (10-100 pb da sequência de ShineDalgarno - SD) Funções do terminador da transcrição – TT - A jusante da sequência clonada impede a transcrição através de outro promotor, o que pode inibir a sua função, fenómeno conhecido por oclusão do promotor - Aumenta a estabilidade do mRNA UAA - codão stop mais frequente UAAU - codão stop mais eficiente Promotores utilizados em E. coli Promotor (origem) Regulação Indução Plac (E. coli) lacI, lacIq IPTG Ptac, P híbrido (E. coli, box -35 do P do operão do lacI, lacIq triptofano, box -10 do P do operão da lactose) IPTG PL ( λ) λcIts857 Térmica PT7 (T7) λcIts857 lacI, lacIq Térmica IPTG Representação esquemática da repressão do promotor PL de λ O repressor codificado pelo gene cI857 é sensível à temperatura. Utilização do gene cI857 no sistema de expressão PT7 Sistema de expressão: Plasmídio com PL a montante do gene 1 Vector com PT7 a montante do gene em estudo Genoma do hospedeiro com λcI857 O gene 1 codifica a polimerase de RNA T7 específica do promotor PT7 A polimerase de RNA de E. coli reconhece PL A polimerase de RNA de E. coli é selectivamente inibida pela rifampicina 1º Indução – Síntese da polimerase de RNA T7 por elevação da temperatura de incubação de E. coli 2º Adição de rifampicina – Inibição da polimerase de RNA de E. coli Nestas condições só ocorre síntese da proteína do gene em estudo. Sistema de expressão PT7 sob controlo do Plac Regulação lacI, lacIq Indução por IPTG Efeito da diferente utilização de codões na expressão génica com baixa frequência de utilização em E. coli Haverá baixa expressão proteica se o DNA clonado tiver codões pouco utilizados em E. coli. Soluções: Mutagénese sítio-específica (alteração de nucleótidos sem alteração de aminoácidos) Coexpressão do gene argU que codifica o tRNA Arg (AGG/AGA) Tipos de vectores de expressão Os vectores de expressão são de dois tipos: Vectores de fusão transcricional – fornecem apenas o promotor Vectores de fusão traducional – fornecem o promotor e os sinais de tradução (RBS e codão de iniciação da tradução) Fusões transcricionais e traducionais (1) Em ambos os vectores o inserto deve estar clonado na orientação correcta. Fusões transcricionais e traducionais (2) • Na fusão transcricional, o promotor e o gene constituem uma unidade transcricional, isto é, a transcrição iniciada a partir do promotor continua através do gene clonado. O vector fornece o promotor. O inserto contém os sinais de tradução – RBS e codão de iniciação da tradução. É produzida proteína nativa. • Na fusão traducional também se forma uma unidade transcricional. O vector fornece o promotor e os sinais de tradução. É produzida proteína de fusão ou proteína híbrida, em que parte do produto da tradução (proteína ou polipéptido) é derivado do inserto e parte do vector. Requisitos da fusão traducional • É preciso conhecer a sequência de nucleótidos do inserto e avaliar o resultado da clonagem num determinado local. • O inserto deve estar na mesma grelha de leitura do ATG do vector. • Pode ser necessário mudar de vector, ou modificar o vector ou o inserto (utilizando linkers ou adaptadores). Alternativamente, o inserto pode ser produzido por PCR, com primers que contêm um local de restrição que produz a grelha correcta. • É fundamental testar por sequenciação o produto recombinante para confirmar a correcta inserção do fragmento de DNA. A perda de uma base durante a ligação resulta numa grelha de leitura incorrecta. • As proteínas toleram uma variação considerável de aminoácidos na extremidade N, mas para fins terapêuticos em humanos devem ser utilizados produtos iguais aos naturais. Exemplo de fusão traducional em fase 1. 2. Em 1., fusão traducional em fase; em 2., fusão traducional incorrecta. Clonagem num vector de expressão plasmídico lac A sequência de DNA que codifica a proteína relevante é clonada num vector de expressão. O vector de expressão tem um promotor forte, adjacente ao gene que codifica a proteína, que origina grandes quantidades de mRNA. O DNA recombinante é introduzido em bactérias, leveduras, células de insecto, ou células de mamífero, onde o gene clonado é transcrito e traduzido eficientemente. A clonagem de expressão permite a produção de grandes quantidades da proteína relevante. Vectores de expressão em duas etapas Expressão de genes letais PT7 – promotor com um controlo muito apertado Vector pET-3 NdeI BamHI O promotor do fago T7 permite elevado nível de expressão; a sequência líder do gene 10 (estimulador da tradução) do fago T7 assegura elevado nível de tradução; NdeI e BamHI são locais de clonagem. A clonagem em BamHI origina uma proteína de fusão contendo 13 aminoácidos N-terminal do gene 10 do fago T7. Clonagem num vector λ de expressão (1) Vector λgt11 A identificação do DNA clonado é feita por hibridação com um anticorpo específico da proteína expressa. Figure 7-21. [Adapted from J. D. Watson et al., 1992, Recombinant DNA,2d ed., Scientific American Books.] Detecção de proteínas com anticorpos Funções do tag O tag é uma curta sequência de nucleótidos que codifica um péptido com poucos aminoácidos. • Pode ser adicionado à extremidade N ou C do produto do gene clonado. • Permite a detecção e purificação de proteínas. • Péptidos de fusão específicos conferem vantagens à proteína alvo durante a expressão: aumentam a solubilidade, protegem da proteólise, melhoram a conformação, aumentam a produção. • São vários os tags utilizados nos vectores de clonagem: His6 Glutationa-S-transferase (GST) Proteína de ligação a maltose (MBP) Proteína verde fluorescente (GFP) Epítopos Tag adicionado ao inserto Por engenharia genética, um tag (epítopo) pode ser adicionado ao inserto. Figure 8-48. © 2000 by W. H. Freeman and Company Vectores com tag Detecção de proteínas com tag Purificação de proteínas com tag As proteínas com tag são purificadas em colunas de cromatografia de afinidade. Vectores de fusão génica pGEX-4T A partir de EcoRI os locais múltiplos de clonagem de pEGX-4T-1, -2 e –3 configuram as três grelhas de leitura possíveis dos codões. A proteína de fusão é constituída pela componente N-terminal de GST (tag) e pela componente C-terminal da proteína pretendida. Pode ser purificada numa coluna de purificação de afinidade de glutationa (ex. sefarose 4B glutationa) e clivada com trombina. Purificação de complexos proteicos associados a proteínas de fusão com GST (1) Figure 8-50. © 2002 by Bruce Alberts, Alexander Johnson, Julian Lewis, Martin Raff, Keith Roberts, and Peter Walter. Vectores de fusão génica pRSET tag EK – local de clivagem pela enterocinase para remoção do tag Funções do péptido sinal • A secreção de proteínas por bactérias depende normalmente da presença de um péptido sinal na extremidade N. As proteínas são reconhecidas pela maquinaria de secreção e transportadas através da membrana citoplasmática. • A sequência de nucleótidos que codifica o péptido sinal existe no vector ou é incorporada no inserto. A secreção nem sempre acontece, dependendo da estrutura da proteína. Gene repórter Gene repórter é um gene que produz uma proteína que pode ser detectada e quantificada utilizando um teste simples. Exemplos de genes repórter: GFP (Green fluorescent protein) lacZ (β-galactosidase) luc (luciferase) Utilização de genes repórter na localização de proteínas recombinantes A) Proteína com tag GFP B) Ratinho transgénico com GFP em fusão com uma proteína epitelial A) O gene recombinante codifica uma proteína de fusão que contém GFP C-terminal. B) O ratinho contém um transgene marcado com GFP expresso no corpo; o ratinho fluoresce quando iluminado com luz UV. Figure 19. 18 Genetics: From genes to Genomes, 2/e. (© McGraw-Hill Companies, 2004) Vectores promoter-probe Os vectores promoter-probe permitem detectar a existência de promotor no fragmento clonado, através da expressão do gene repórter (gene lacZ) Avaliação do nível de expressão de promotores Teste de detecção da β-galactosidase em que se utiliza o substrato ONPG A análise dos dados revela: • A eficiência de tradução do gene lacZ é maior do que a do gene em estudo (por comparação entre fusões transcricionais e traducionais). • Não há oclusão de promotor (por comparação entre resultados de diferentes fragmentos). A activação da transcrição do gene em estudo é maior quando os dois promotores estão presentes. Expressão heteróloga em Saccharomyces cerevisiae Vantagens • • • • • • • • • Organismo unicelular (altemativa eucariótica de E. coli) Genética e fisiologia conhecidas Crescimento rápido Vários promotores fortes (CYC1, ADH1, GAL1O) Plasmídio natural denominado 2-µm Modificações pós-traducionais Não patogénico Elevada produção proteica Produção industrial Vectores de clonagem em leveduras Nestes vectores, a função dos insertos é estudada por transfecção da estirpe de levedura de genótipo adequado. São necessárias marcas de selecção para a detecção de clones recombinantes. ARS – Sequência de replicação autónoma As origens de replicação são os locais necessários para as enzimas de replicação bacterianas e de levedura iniciarem o processo de replicação. O DNA derivado do plasmídio natural de levedura, 2-µm, tem a sua própria origem de replicação. Representações simplificadas de quatro tipos diferentes de vectores de clonagem em leveduras. Figure 13-11. © 2000 by W. H. Freeman and Company. Especificidades da clonagem em leveduras Métodos de transfecção em leveduras • Protoplastos • Acetato de lítio • Electroporação Leveduras utilizadas como hospedeiros • Saccharomyces cerevisiae • Kluyveromyces lactis • Schizosaccharomyces pombe • Yarrowia lipolytica • Hansenula polymorpha • Pichia pastoris (Os vectores de expressão com o promotor AOX1- gene que codifica a enzima álcool oxidase - geram níveis elevados do produto pretendido (gramas/litro), com menores custos do que os sistemas de insectos e de mamíferos. Ao contrário dos sistemas bacterianos, os vectores de P. pastoris não são mantidos epissomicamente, mas são construídos para serem integrados num cromossoma da levedura. São vectores shuttle com origens de replicação em levedura e em E. coli.) As leveduras utilizadas como hospedeiros são geralmente mutantes auxotróficos. Exemplos: TRP1, LEU2, URA3 A selecção das células transfectadas é feita por complementação de deficiências metabólicas. Clonagem num plasmídio epissómico de levedura Há menor número de antibióticos disponíveis para os quais as leveduras são sensíveis (embora alguns fungicidas possam ser utilizados) e, por isso, a selecção baseiase, frequentemente, na complementação de mutações auxotróficas da estirpe hospedeira. Os vectores que replicam como plasmídios em S. cerevisiae são muitas vezes bastante instáveis, na medida em que tendem a ser perdidos na cultura devido à acumulação de células sem plasmídio. Isto é devido a uma partição errada durante a mitose. Os vectores com ARS são muito instáveis, mas quando incluem o centrómero são mais estáveis. Os vectores são, em geral, vectores de expressão porque expressar o gene clonado é uma das finalidades da utilização de leveduras como hospedeiro. Clonagem num vector YAC Características do vector YAC e do hospedeiro As sequências do vector são: CEN4 - sequência centromérica TEL - sequências teloméricas ARS1 - sequência de replicação autónoma em levedura Amp - gene que confere resistência à ampicilina para selecção em E. coli ori - origem de replicação para propagação em E. coli SUP4 - gene que codifica o tRNA supressor da mutação ade-2 do hospedeiro e restaura a actividade selvagem, originando colónias brancas TRP1 e URA3 - genes envolvidos no metabolismo do triptofano e uracilo, respectivamente Características do hospedeiro (estirpe AB1380 de levedura): ade-2 - mutação ocre no gene envolvido no metabolismo da adenina que resulta na acumulação de pigmento vermelho (colónias vermelhas). A clonagem de um fragmento de DNA exógeno no gene SUP4, inactiva a função supressora do gene, originando o fenótipo mutante. trp1 e ura3 - alelos complementados pelos alelos correspondentes do vector, constituindo um sistema de selecção para identificar as células que contêm o vector YAC. Expressão heteróloga em células de mamífero Realização de modificações pós-traducionais idênticas às naturais. Expressão transitória – expressão obtida sem integração do vector Expressão estável – expressão resultante da integração do vector de expressão num dos cromossomas do hospedeiro Promotores utilizados na construção de vectores de células de mamífero: PSV40 (Simian Virus) PRSV-LTR (Rous Sarcoma Virus) PMSV-LTR (Murine Sarcoma Virus) PBPV-1 (Bovine Pappilomavirus Type 1) PCMV (Citomegalovirus) Vector de expressão em células de mamífero, pcDNA3.1/myc-HIS Características do vector pcDNA3.1/myc-HIS Vector shuttle que permite elevado nível de expressão constitutiva em células de mamífero PCMV – promotor forte de citomegalovírus que assegura elevado nível de expressão BGH pA – elemento da sequência de poliadenilação da hormona de crescimento bovino que permite a produção de uma extremidade 3’ definida no mRNA obtido a partir do inserto. neo – gene marcador, regulado por um promotor/estimulador e sequência poli A SV40, que permite a selecção por crescimento em G418 (geneticina) Polylinker – contém locais múltiplos de clonagem 6xHis – sequência que especifica seis resíduos de histidina consecutivos que facilita a purificação da proteína recombinante Epítopo myc – tag que permite a triagem com anticorpos da proteína recombinante utilizando um anticorpo específico para esta sequência Term – sinais de terminação da tradução SV40 ori – origem de replicação em células de mamífero Componentes de propagação em E. coli pUC ori – origem de replicação derivada do plasmídio ColE1 Amp – gene que confere resistência à ampicilina f1 ori – origem de replicação do fago filamentoso f1 que permite produzir recombinantes de cadeia simples Características das células COS As células COS permitem que qualquer DNA circular com uma origem de replicação SV40 replique independentemente do DNA celular. É uma linha estável de células de rim de macaco verde Aficano derivada da linha celular de macaco, CV1, permissiva de SV40. Quando as células CV1 são infectadas com SV40, ocorre o ciclo lítico normal do vírus. As células CV1 foram transformadas por integração nos cromossomas de um fragmento de DNA genómico de SV40 contendo uma origem de replicação mutante. As células COS resultantes (CV1 com origem defectiva de SV40) expressam constitutivamente (estavelmente) o antigénio T codificado por SV40, a única proteína viral que é necessária para activar a origem de replicação de SV40. Vector pBK-CMV Características do vector pBK-CMV