METODOLOGÍA DE LA CIENCIA Regulación de la Expresión génica Integrantes: Contanza Molina Francisco Navarro Felipe Pino Daniela Retamales Maria de los Ángeles Zuñiga 1 Las células eucariontes tienen la capacidad de formar organismos multicelulares, en donde cada célula esta íntimamente relacionada con otra. Todos los organismos multicelulares, como por ejemplo los mamíferos, se originan a partir de una única célula, denominada cigoto. Este es producto de la unión de dos gametos, masculino y femenino, cada uno de los cuales proviene de uno de los progenitores. Esta célula original posee todas las instrucciones para construir un organismo totalmente completo. Estas instrucciones o información, se encuentra contenida en un polímero llamado ácido desoxirribonucleico (DNA), el cual constituye el genoma determinado por cada especie. Su estructura consiste en dos largas hebras helicoidales enrolladas, que forman una doble hélice. Las cadenas (hebras) de DNA están formadas por nucleótidos, cada uno de los cuales esta compuesto por una desoxirribosa (azúcar - pentosa), un grupo fosfato y una base nitrogenada; esta es la porción por la cual se diferencia un nucleótido de otro. Son cuatro nucleótidos diferentes: adenina (A), timina (T), guanina (G) y citosina (C), unidos de a pares a lo largo de la doble hélice. Estas bases se unen de acuerdo a la complementariedad determinada, donde A se une a T y C se une a G. La información genética se almacena en la secuencia lineal de los nucleótidos de un DNA. Esta secuencia se divide en diferentes porciones conocidas como genes. Las investigaciones demuestran que estos, en células eucariontes, se encuentran divididos en dos partes: una región codificante (exón) y otra reguladora (intron). El desarrollo del organismo multicelular comienza con la proliferación celular, por medio de la mitosis. La división celular continúa dando paso a un proceso llamado diferenciación, que tiene como consecuencia la generación de los distintos tejidos de un organismo completo. Cada tejido es diferente de otro, sus células difieren. Los distintos tipos celulares, en condiciones normales, van a producir única y exclusivamente las proteínas pertenecientes a su linaje. Por ejemplo, un hepatocito (célula del hígado) va a producir proteínas, pero no va a sintetizar las mismas que una célula pancreática, y viceversa. Pero, ¿Cómo sabe la célula que proteínas sintetizar o cuales no? Las proteínas son moléculas formadas por la célula, mediante el enlace lineal de los 20 aminoácidos que componen el código genético. Por una mejor compresión del tema es 2 necesario explicar los procesos para producir una proteína. La célula debe pasar por dos procesos: la transcripción de DNA a RNA y luego la traducción de este. La transcripción ocurre en el núcleo de la célula, y consiste en la copia de un gen del DNA a una hebra simple de nucleótidos, que difiere del DNA por el azúcar de sus nucleótidos, ahora ribosa, y el cambio de timina por uracilo (U), llamado ácido ribonucleico (RNA). Para procariontes los genes codifican para más de una proteína, formando grupos de genes, conocidos como operones, y rara vez contienen intrones, por lo que la traducción del mRNA ocurre enseguida. Por el contrario, en eucariotas, esta copia se conoce como transcripto primario, debido a que no solo contiene la secuencia cifrada o codificante (exon) de proteína, sino que también lleva secuencias no codificantes, los intrones. Estos fueron descubiertos cuando investigadores realizaban experimentos de hibridación, en los cuales intentaban aparear un mRNA con el gen del cual había sido transcrito, y notaron la gran diferencia de tamaño entre ambos. Se pensaba que los intrones eran material de desecho, pero hoy se sabe se que tienen una importante función, como secuencias reguladoras. La molécula primaria (RNA), no puede actuar como molde directo para la síntesis de proteínas, debido a que contiene intrones, es por esto que debe pasar por un nuevo proceso llamado splicing (empalme), en el cual se escinden los intrones de la hebra y se produce el empalme de los exones, quedando así una secuencia libre de regiones no cifradas y formándose una molécula mas pequeña, solo de regiones codificantes, llamada RNA mensajero (mRNA). Este mRNA se mueve hacia el citoplasma, saliendo del núcleo, para que ocurra la traducción del mensaje. La traducción ocurre en los ribosomas, los cuales comienzan a agregar los aminoácidos que formaran la proteína de acuerdo al orden dictado por la secuencia de nucleótidos del mRNA. Es así como una célula produce la proteína deseada. Explicado esto debemos volver a nuestra pregunta ¿Por qué la célula sintetizo esa o esas proteínas y no otras? ¿Existe un componente que regule la transcripción? 3 “Todos los organismos poseen una forma de controlar cuando y donde se pueden transcribir sus genes”¹. Efectivamente toda célula cuenta con un mecanismo que regula la expresión de sus genes. En el caso de organismos multicelulares, todas las células diploides (2n) contienen la misma información, pero no todas tienen activos los mismos genes para hacer proteínas, solo mantienen activados aquellos genes relacionados con la función celular. La expresión génica, generalmente, es controlada a nivel de la transcripción. Tal control de los genes se debe al accionar de la maquinaria molecular de control genético, la cual se une al DNA y actúa activando o desactivando la transcripción de los genes. Los componentes de esta maquinaria molecular son conocidos como factores de transcripción. Estos deben ensamblarse uniéndose al DNA, en secuencia promotora de transcripción, antes de que la RNA polimerasa, comience la transcripción. La principal finalidad del control génico en organismos complejos es adaptar a las células en beneficio de este. Además este control genético es de vital importancia en el momento en que ocurre la diferenciación celular y durante el desarrollo, ya que un mismo tipo celular puede producir variantes de la proteína que sintetiza, en las distintas etapas de su desarrollo. En las células procariontes la regulación génica es llevada a cabo por activación o represión de ciertos genes, en respuesta a los cambios en el ambiente con respecto a los nutrientes, por lo que se puede decir que ocurre mas por ahorro de energía, transcribiendo solo los mRNA necesarios para codificar una proteína necesaria. Claro es el ejemplo del operon Lac, en el cual la enzima que cataliza lactosa solo es sintetizada en caso que no haya glucosa y si haya lactosa, es decir, el gen esta reprimido y solo en caso de necesidad es activado. La RNA polimerasa de las bacterias es muy promiscua, es “incapaz de reconocer entre una secuencia promotora de otra cualquiera en el DNA”², por lo que desarrollaron proteínas que se unen a la RNA polimerasa para que esta se dirija a las secuencias promotoras y transcriba la secuencia correcta. Estas proteínas son los factores sigma, si estos no existieran la activación diferencial de los genes bacterianos seria casi tarea imposible. 4 En los todos los eucariotas, existe en su genoma, tres tipos de secuencias de nucleótidos que son necesarias para que la RNA polimerasa inicie la transcripción. Una de ellas es el centro promotor, que actúa como un promotor bacteriano, desde el cual la enzima RNA polimerasa comienza su acción. Este centro promotor es común en muchos genes. Se identificaron también elementos reguladores que estimulan o reprimen la transcripción, intensificadores (enhancers) y silenciadores, respectivamente. Estas secuencias son de ≈ 10 a 20 pares de bases. Estos pueden encontrarse cerca del centro promotor o incluso a miles de nucleótidos del gen que regulan. Los genes eucariotas pueden contar con varios de estos elementos; incluso dos genes distintos pueden compartir idénticos intensificadores (amplificadores) o silenciadores, pero no hay dos genes con la misma combinación. De esta manera el ritmo de transcripción de los genes es controlado de forma independiente uno de otro. Luego de muchos estudios se llego a la conclusión que estos elementos, silenciadores e intensificadores, no podían controlar solos la activación de la RNA polimerasa. Se creía que estos funcionaban mas bien como zonas de unión de proteínas, activadoras o represoras, y serian estas los componentes responsables de enviar mensajes que estimularían o reprimirían el actuar de la RNA polimerasa, es decir, el ritmo de la transcripción dependería, no de las secuencias, sino de las maquinarias proteicas unidas a ellas. Y al parecer tenían razón. En 1982 se identifico un componente que se unía a un elemento regulador, denominado bloque GC, por ser rico en estos nucleótidos. Este factor fue encontrado en una mezcla de proteínas nucleares. Además se determino que era especifica, ya que al agregar RNA polimerasa a la mezcla, solo se estimulaba la transcripción de genes que portaban bloques GC. Este fue el primer factor transcripcional identificado en células humanas y fue nombrado SP1 (specific protein 1). Los factores transcripcionales se dan en pequeñas concentraciones por lo que su purificación no fue fácil. Para purificar la proteína se sintetizo una molécula de DNA que solo contenía bloques GC. Luego se pasó por una mezcla de proteínas nucleares humanas, y sabiendo que SP1 5 quedaría unida, se pudo purificar. Este mecanismo de purificación fue establecido por James T. Kadonga en 1985. Según estudios realizados a factores transcripcionales estos contenían dominios funcionales diferentes. Al descifrar la secuencia de aminoácidos en SP1 se determino que estas proteínas contenían dos dominios importantes. Un extremo del factor contenía tres dedos de cinc, los cuales se forman cuando se pliega una región en torno a un átomo de cinc. Este extremo facilitaría la unión del factor a la molécula de DNA. El otro dominio esta formado por dos prolongaciones y es rico en glutamina (aminoácido). Este dominio corresponde al otro extremo de la molécula. Este extremo fue denominado activador, ya que en ausencia de el, la SP1 puede unirse al DNA, pero no influye en la transcripción, por lo tanto este dominio debía interactuar con otros factores y así estimular la RNA polimerasa. En 1988 se demostró que para transcribir genes en eucariontes no bastaba solo con tener RNA polimerasa. Tiene que haber ensamblado en el centro promotor otros factores, llamados basales. Existen seis tipos identificados: A, B, D, E, F y H. En un tubo de ensayo estos factores ubican a la polimerasa en sitios de unión de la transcripción, y ayudan a separar las hebras de DNA, permitiendo que la polimerasa pueda transcribir un gen a un ritmo basal, bajo e invariante. Pero al agregar SP1, la velocidad de la transcripción tiene un gran incremento. A modo de resumen “los factores basales son requeridos para la iniciación de la transcripción en todos los genes; otras proteínas – activadores y represores - dictan el ritmo de inicio de la transcripción por el complejo basal”. Aun quedaba por descifrar que factor basal interactuaba con la SP1. Se sospechaba del factor D, ya que es el único componente basal que entra en contacto directo con la molécula de DNA, uniéndose a la secuencia bloque o caja TATA. 6 El aislamiento del factor D en células humanas resulto muy complicado, por lo que se utilizo proteínas aisladas de levadura que al parecer eran igual que el factor D; se conoce como TBP (TATA binding protein). En base a preparaciones de factor D sin purificar B. Franklin Pugh comprobó que el factor D y la proteína TBP no eran equivalente, ya que a pesar de no influir en la transcripción basal, la TBP no interactiva con SP1. Se determino que el factor D constaba de TBP y otras subunidades, que no eran necesaria en la maquina basal, pero si para que los activados pudieran actuar. Al parecer estas subunidades constituían una tercera clase de factores transcripcionales, denominador coactivadores. Se propuso esta hipótesis, porque no podía ser que una sola proteína (TBP) fuera capaz de interactuar con muchos activadores a la vez, pero si a esta se le unían otras subunidades con sitios de unión podría soportar la transmisión de mensaje de muchos activadores. Los coactivadores podrían funcionar como tales moléculas adaptadoras. En 1991 se pudo purificar el factor D, con todos sus componentes, incluida la TBP; la unidad completa constaba de 8 subunidades hasta ese entonces totalmente desconocidas. Fueron denominadas genéricamente TAF, o factores asociados a la TBP. Con este hallazgo se pudo comprobar que el factor D si contaba de coactivadores, ya que los TAF interactuaban de forma directa con activadores. El conjunto de coactivadores del factor D actúa como procesador de señales de los activadores. La maquinaria molecular eucariótica, formada por activadores, coactivadores y complejos basales, es el equivalente de los factores sigma en bacterias, influyendo en el ritmo de transcripción y la unión de la enzima RNA polimerasa al centro promotor. Análisis de las secuencias de estos factores, indican que los provenientes de levadura y células humanas coinciden en un 80% por lo que existe la posibidad que esta maquinaria molecular sea una forma universal de regulación génica en eucariotas. 7 Los represores, son los opuestos funcionales de los activadores. Constan de dos dominios, uno de unión al DNA y otro de represión, que al igual que los dominios de activación, los de represión funcionan en interacción con otras proteínas. Por ahora se cree que los coactivadores y correpresores son fundamentales para que los factores de transcripción (activadores y represores) puedan manejar la expresión génica en eucariotas. “Las células fabrican diferentes proteínas, porque portan mezclas distintas de activadores y represores”. Al parecer la respuesta a como la célula controla la expresión génica es, cada día mas clara. Por ejemplo hoy se sabe que, en genes humanos, la maquinaria que controla la transcripción consta de al menos unas 50 proteínas distintas. Estas deben ensamblarse de manera adecuada para que la RNA polimerasa pueda actuar y transcribir correctamente la información para sintetizar las proteínas esperadas. Si lográramos descifrar y entender completamente la maquinaria que controla la expresión de genes humanos, quizás en algún momento de la historia, se pueda dar fin a enfermedades producidas por exceso de proteínas o falta de ellas, aplicando lo aprendido, en busca de posibles terapias de inhibición de la transcripción o activación de esta, respectivamente.