Álgebra y Genética Cursillo “La falta de relación entre la Matemática y la Biología es o una tragedia o un escándalo o un reto, es difícil decidir cual de las tres” Gian Carlo Rota Dr. Jesús Hernando Pérez Universidad Sergio Arboleda Stefany Moreno Instituto Alberto Merani XVI Encuentro de Geometría y IV de Aritmética 23 a 25 de Junio de 2005 1 Biomatemática La Biomatemática es la ciencia mediante la cual se analiza un fenómeno biológico desde los modelos matemáticos, y se obtienen modelos matemáticos a partir de fenómenos biológicos. La Sucesión de Fibonacci. 2 Contenido del Cursillo Primera Parte: Introducción al Cursillo. Tema: La Estructura Algebraica de la Herencia Genética. Segunda Parte: Tema: El Código Genético como un Álgebra de Codones. Conclusiones Generales del Cursillo. 3 Proyecto en proceso Modelo Hawk – Dove. Condiciones Generales: Dos individuos (especies) compiten por un recurso. Los individuos son de dos tipos: Hawk (Halcón) o Dove (Palomas). Se utiliza el Modelo Hawk - Dove de la Teoría de Juegos en el cual los dos individuos son los jugadores. Corroboración Experimental con larvas de Ischnura elegans (Odonato). 4 PRIMERA PARTE 5 Conceptos Biológicos Necesarios Gen: Es la unidad fundamental de la herencia cuya existencia se puede confirmar por variantes alélicas y que ocupa un locus cromosómico concreto. Cromosoma: Molécula de DNA, RNA y proteínas que forma una estructura filamentosa donde se encuentra la información genética en una secuencia lineal. 6 7 8 Conceptos Biológicos Necesarios Alelos: Uno de los posibles estados de un gen, diferente de otros alelos por sus efectos fenotípicos. Diploidía: Doble dotación cromosómica (2n) en la cual los cromosomas se hallan en parejas. 9 Conceptos Biológicos Necesarios Haploidía: Dotación cromosómica simple (n). Meiosis: Proceso de división celular en el cual de una sola célula diploide (2n) se pasa a cuatro haploides (n). 10 Conceptos Biológicos Necesarios Gameto: Célula reproductora Haploide (n) cuyo núcleo se fusiona con otra (n). Zigoto: La célula diploide (2n) que resulta de la fusión de los gametos masculinos y femeninos. 11 12 Conceptos Biológicos Necesarios Homozigotos: Organismo diploide (2n) que lleva alelos idénticos en uno o más loci genéticos. Heterozigotos: Organismo diploide que lleva dos alelos diferentes en uno o más loci genéticos. 13 14 Conceptos Biológicos Necesarios Genotipo: La constitución genética de un individuo. Fenotipo: Características observables de un individuo. 15 Conceptos Matemáticos Necesarios Un conjunto G es un grupo si tiene una operación + (se nota (G,+)) tal que: 1. Para a, b, c ∈ G a + (b + c) = (a + b) + c. 2. Existe un e ∈ G tal que para todo a ∈ G e + a = a + e = a. 3. Para todo a ∈ G existe un a-1 tal que a + (-a) = (-a) + a = e. 4. Si + es conmutativa se dirá que el grupo es abeliano. 16 Conceptos Matemáticos Necesarios Un conjunto A es un anillo si tiene dos operaciones +, · (se nota (A, + , ·) ) las cuáles cumplen lo siguiente: 1. (A ,+) es un grupo abeliano. 2. Para a, b, c ∈ G a · (b + c) = (a · b) + (a · c). (b + c) · a = b · a + c · a 17 Conceptos Matemáticos Necesarios Dado un grupo G y un subconjunto H de G, se dice que H es un subgrupo de G si e ∈ H (El neutro de G es neutro de H) Para a, b ∈ H, a + b ∈ H. Para a ∈ H, (-a) ∈ H. Dado un anillo A y un subconjunto R de A, se dice que R es un subanillo de A si R es un subgrupo de (A,+) Para a, b ∈ R, a · b ∈ R 18 Conceptos Matemáticos Necesarios Para dos subconjuntos A y B de un anillo M, A·B esta definido como: {a·b| a ∈ A y b ∈ B} Si A es un subconjunto de un anillo M, <A> es el subanillo más pequeño que contiene al conjunto A. 19 Potencias Principales Para un anillo C, un x ∈ C y un subanillo U de C las potencias principales están definidas inductivamente como: x1 = x. U1= U xi = xi-1 x Ui = <Ui-1U> i ∈ N. i ∈ N. Una población Pi representa el cruce entre Pi-1 y P. 20 Potencias Enteras Para un anillo C, un x ∈ C y un subanillo U de C las potencias enteras están definidas inductivamente como: x[1] = x. U[1]= U x[i] = x[i-1] x[i-1] i ∈ N. U[i] = <U[I-1] U[I-1]> i ∈ N. Una población P[i] representa el cruce entre P[I-1] y P[I-1] . 21 Potencias Enteras y Principales Ejemplos: x4 = x3 x = (x2 x) x = ((x x) x) x x[4] = x[3] x[3] = (x[2] x[2] )(x[2] x[2] ) = ((x x)(x x)) ((x x)(x x)). 22 Conceptos Matemáticos Necesarios 1. 2. Un anillo (C, + , ·) es un cuerpo si satisface además las siguientes propiedades: Es un Anillo en el cual la operación · tiene un elemento unidad (notado como 1), es conmutativa y asociativa. Para todo a ∈ C, a ≠ 0, existe un a-1 tal que a · a-1 = a-1 · a = 1. 23 Conceptos Matemáticos Necesarios Si R es un anillo, un R-módulo M es un grupo abeliano junto con una operación RxM (r, m) M r ·m que satisface las siguientes propiedades: a (b x) = (a b) x a (x + y) = a x + a y 1 x = x (Si el anillo tiene unidad) (a + b) x = a x + b x Para todo a, b ∈ R y todo x, y ∈ M. 24 Conceptos Matemáticos Necesarios Si R es un anillo, una R-álgebra es un R – módulo A, tal que A es también un anillo y satisface la siguiente propiedad: (a x) y = a (x y) = x (a y) para todo a ∈ R y todo x, y ∈ A. 25 Conceptos Matemáticos Necesarios Un Homomorfismo entre grupos es una función f de un grupo A en un grupo B para la cual f (a + b) = f (a) + f (b), con a, b ∈ A 26 Conceptos Matemáticos Necesarios Un Homomorfismo f de un grupo A en un grupo B es inyectivo si f(a) = f(b) implica que a = b. ∀ a,b ∈ A. Un Homomorfismo f de un grupo A en un grupo B es sobreyectivo si ∀ b ∈ B existe un a ∈ A tal que f(a) = b. Un Homomorfismo es un isomorfismo si es inyectivo y sobreyectivo. 27 Conceptos Matemáticos Necesarios Para un Homomorfismo f de un grupo A en un grupo B el núcleo (Kernel) esta definido como el siguiente subgrupo: Ker (f) = {a ∈ A | f(a) = e}, donde e es el elemento neutro de B. Para un anillo A, un elemento a ∈ A es nilpotente si an = 0 (Potencias Principales) para algún n ∈ Z+ (El menor n que cumple esta condición se denomina el índice de a) Para B subanillo de A, decimos que B es nilpotente si existe n ∈ N tal que el producto de cualesquiera n elementos de B es igual a 0. 28 Conceptos Matemáticos Necesarios Idempotentes: Para un anillo A y un m ∈ A, m ≠ 0, m es idempotente si m2 = m. Un subconjunto P de un anillo es idempotente si P · P = P. Genéticamente, esto ultimo se interpreta como una población que independientemente de sus características genotípicas es estable. 29 Conceptos Matemáticos Necesarios Dado un Modulo W, un submòdulo H de W, es un subconjunto cerrado para las operaciones de W. Si W1 y W2 son submódulos de un módulo W se define la suma interna como W1 + W2 = {w1 + w2 : wi ∈ Wi} Si W1 + W2 = W, y si W1 ∩ W2 = 0, W se dice que es la suma directa de W1 con W2 y se escribe W = W1 ⊕ W2 30 Álgebras con Realización Genética Álgebras Gaméticas. Álgebras Zigóticas. 31 Tabla para un álgebra gamética A a A a A ½(A+a) ½(A+a) a 32 Tabla para un álgebra zigótica AA Aa aa AA AA ½(AA+Aa) Aa Aa ½(AA+Aa) aa Aa ¼AA+½Aa+¼aa ½(Aa+aa) ½(Aa+aa) aa 33 Carácter No Asociativo de la Herencia Genética (P x Q) x R ‡ P x (Q x R) Ejemplo: A x (A x a) = ¾A + ¼a (A x A) x a = ½ A +½a Los elementos del Álgebra son sumas de la forma: w AA + y Aa + z aa 34 Álgebras Gaméticas Población con n alelos {a1,a2,...,an} . n aiaj = ∑ cijkak K=1 Tal que 0≤ n cijk ≤ 1 i,j,k = 1,...,n ∑ cijk = 1 i,j= 1,...,n K=1 cijk = cjik i,j,k = 1,...,n 35 Álgebras Zigóticas n aijapq = ∑ cij,pq,ksaks K≤s Tal que 0≤ n cij,pq,ks ≤ 1 ∑ cij,pq,ks= 1 i,j,k,p,q,s = 1,...,n i,j,p,q= 1,...,n K=1 cij,pq,ks = cpq,ij,ks i,j,k,p,q,s = 1,...,n 36 Álgebras con Realización Genética (Generalización) Supongamos que A es un álgebra sobre R de dimensión n. {a1,a2,...,an} una base de A sobre R. aiaj = ∑ cijkak K=1 Tales que 0≤ cijk ≤ 1 i,j,k = 1,...,n n ∑ cijk = 1 i,j= 1,...,n K=1 37 Álgebras Báricas Un álgebra A sobre un campo k es un álgebra bárica si admite un homomorfismo no trivial w: A→ k. w es llamado el homomorfismo de peso o la función bárica. En algunos casos w no es único. 38 Álgebras Báricas Teorema 1. Tomemos A como una álgebra n- dimensional con realización genética sobre ℝ. Entonces A es un álgebra bárica. 39 Álgebras Báricas ¿Tiene solo un homomorfismo de peso un álgebra bárica? a1 a2 a3 a1 a1+a2 a2 a2 a2 a2 a2 a2 a3 a2 a2 a2+a3 40 Álgebras Báricas w1: A → ℝ w1(a1)=1 y w1(a2)=w1(a3)=0 w2: A → ℝ w2(a3)=1 y w2(a1)=w2(a2)=0 41 Potencias Enteras y Principales Teorema 2: Tomemos A un álgebra bárica sobre un campo k, con función de peso w. Si N = Ker w es nilpotente, entonces w es único. 42 Idempotentes Teorema 3. Tomemos A un álgebra bárica sobre un campo k con función de peso w. Supongamos que A contiene un idempotente e tal que w(e)=1. Entonces, A = ke ⊕ Ker w. 43 T - álgebras Tomemos A un álgebra bárica sobre un campo k. Tomemos {a1,a2,..,an} una base de A. Existe un polinomio llamado el rango polinomial que anula todos los elementos de A: f(x) = xr + θ1xr-1+ θ2xr-2+... + θr-1x. Donde θp es un polinomio homogéneo de grado p en las coordenadas ei para x= ∑ni=1 eiai 44 T - álgebras Rango Polinomial --- Relevancia Genética. Tomemos A un álgebra bárica con función de peso w y rango polinomial f(x) = xr + θ1xr-1+ θ2xr-2+... + θr-1x. A es una T-Álgebra de rango r si los coeficientes θp del rango polinomial de A son funciones de w(x). 45 T - álgebras Teorema 4. Tomemos A una T-Álgebra de rango r con función de peso w: A→ k. Entonces todo elemento en N = Ker w es nilpotente de un índice menor o igual que r. Corolario. Una T-Álgebra tiene una única función de peso. 46 T-Álgebras Especiales Una Álgebra bárica con función de peso w es llamada T-Álgebra Especial si N= Kerw es nilpotente 47 Aplicaciones : Autofertilización Autofertilización: Es el poceso en el cual se forma un zigoto a partir de los gametos tanto femeninos como masculinos de un mismo individuo. En este caso corresponde a el cruce de una poblacion consigo misma. P = wAA+yAa+zaa w+y+z=1 48 Autofertilización P es un elemento de un álgebra zigotica con dos alelos. El interés esta cuando P se cruza con P reiteradamente. F1 = P x P F1 = w(AA x AA) + y(Aa x Aa) + z(aa x aa) = wAA + y(¼AA +½Aa+¼aa) + zaa = (w + ¼y) AA + ½yAa + (z + ¼y) aa 49 Autofertilización Fn = wn AA + yn Aa + znaa. ? Un: Diferencia Genética de la población Fn con Fn-1, es decir , Un = Fn– Fn-1 U1 = F1 – P, U2 = F2 – F1. Para el primer caso tendríamos: U1 = ¼y AA - ½yAa + ¼y aa = ½y (½AA – Aa + ½aa ) 50 Autofertilización Para el segundo caso, como F2 = F1 x F1, entonces: F2 =(w + ⅜y)AA + ¼yAa + (z + ⅜y) aa. U2 = ⅛y AA - ¼yAa + ⅛yaa = ¼y (½AA – Aa + ½aa) Generalizando ... 51 Autofertilización Un =⅟2n y (½AA – Aa + ½aa). El total de diferencia genética de población en n generaciones será U1+ U2+...+ Un = = (½AA – Aa + ½aa)(½+¼+...+ ⅟2n)y = y (1 - ⅟2n) (½AA – Aa + ½aa) 52 Autofertilización Fn = w AA + y Aa + z aa + Un = (w +½y - ⅟2n+1 y) AA + ⅟2ny Aa + (z +½y - ⅟2n+1 y) aa. A medida que incrementa n, ⅟2n tiende a 0. Lo que indica que al hacer autofertilización reiteradamente los heterocigotos desaparecen. 53 SEGUNDA PARTE 54 Definiciones Biológicas ADN (Ácido Desoxirribunucleico): Es la molécula de la herencia que contiene toda la información genética del individuo. Nucleótidos: Son los ladrillos que conforman la Estructura del ADN. Están Compuestos por un grupo fosfato, un azúcar (Desoxirribosa) y una Base Nitrogenada. 55 56 57 Definiciones Biológicas Las bases nitrogenadas pueden ser Purinas o Pirimidinas según la cantidad de anillos que tengan. Las Purinas tienen dos anillos (Son mas grandes) y son la Adenina (A) y la Guanina (G). Las Pirimidinas tienen un solo anillo (Son mas pequeñas) y son la Citosina (C) y el Uracilo (U). Esto se conoce como el tipo químico. 58 El Tipo Químico : ¿Purina o Pirimidina? ADENINA (A) GUANINA (G) URACILO (U) CITOSINA (C) 59 Definiciones Biológicas Codón: Es un triplete de nucleótidos que codifica para un aminoácido. Varios aminoácidos unidos conforman una proteína. Mutación: Es un error (No significa entonces que no pueda ser benefica) en la codificación de la proteína. 60 61 Grupo abeliano de cuatro elementos (bases) Axiomas: La base que empieza necesita un mínimo de puentes de Hidrógeno La mayor diferencia entre un elemento y el siguiente es un criterio para hacer los arreglos. El Tipo químico causa la mayor diferencia entre bases. {A, C, G, U} y {U, G, C,A} 62 Grupos abelianos de cuatro elementos (bases) Z4 y V4. Carácter Cíclico. Es decir, que exista un elemento generador. Carácter de estabilidad para la molécula de ADN Por el carácter Cíclico elegimos a Z4 63 Grupos de cuatro elementos (bases) Z4 0 1 2 3 V4 0 1 2 3 0 0 1 2 3 0 0 1 2 3 1 1 2 3 0 1 1 0 3 2 2 2 3 0 1 2 2 3 0 1 3 3 0 1 2 3 3 2 1 0 64 Grupos Cíclicos En Z4 tenemos que un elemento generador es el 1: 2 3 0 1 = = = = 1 1 1 1 + + + + 1. 1 + 1. 1 + 1 + 1. 1 + 1 + 1 + 1. Otro generador es 3. 65 Grupos Cíclicos En V4 tenemos que ningún elemento es generador del grupo: 0 = 0. 0 + 0 = 0 2 =2 2 + 2 = 0 1 =1 1 + 1 = 0 3 =3 3 + 3 = 0 66 Grupo de cuatro elementos (bases) Tablas de Suma para los dos maneras de ordenar: + A C G U + U G C A A A C G U U U G C A C C G U A G G C A U G G U A C C C A U G U U A C G A A U G C 67 68 69 Algoritmo para la Suma de Codones 1. Las bases correspondientes a la tercer posición se suman de acuerdo a la tabla de suma. 2. Si la base resultante está antes que las bases sumadas se lleva C (G en el caso de la dual) 3. Luego se suman las primeras componentes (De acuerdo a la tabla) y si se cumple (2) se lleva C para la suma de las segundas posiciones. 70 Ejemplo Z2 x Z2 x Z2 (0,0,0) (0,0,1) (1,0,0) (1,0,1) (0,1,0) (0,1,1) (1,1,0) (1,1,1) Z8 0 1 2 3 4 5 6 7 71 Grupo de Codones Z4 x Z4 x Z4 = Z64 (Cg,+) Grupo cíclico: k(XYZ). Para todo u en Cg existe un k en Z64 tal que u = k XYZ XYZ = AAC o XYZ = UUG u ⊗ v = k(XYZ) ⊗ k’(XYZ) = =k * k’ (XYZ ⊗ XYZ) = k * k’ (XYZ) 72 Generalización (Cg)n ((Cg)n,+) Anillo:((Cg),+, ⊗) es isomorfo a ((Z64 ),+, ⊗). Genoma: G = P1 ⊕ P2 ⊕ P3 ⊕ ... ⊕ Pm 73 Regularidades Importantes El Codón de inicio (AUG, metionina) es inverso a dos de los codones de parada (UAG, UAA). Los Codones Hidrofílicos son inversos a los codones Hidrofóbicos (simetria). Cuando dos codones codifican para el mismo aminoácido tienen la misma paridad. 74 Mutaciones en el VIH VIH es un virus que infecta a la célula y se reproduce a partir de ella. Existen unos Inhibidores de Proteasa (Enzima que usa el virus para introducir su material genético) cuyo objetivo es que el virus no se reproduzca en las otras células. Las Mutaciones en el material genético del VIH generan Resistencia Cruzada a dichos Inhibidores. Los Conceptos de Orden y Paridad son determinantes para establecer las mutaciones que generaran resistencia cruzada. 75 Orden 76 Orden y Paridad El orden de un elemento a en grupo abeliano G, es el mínimo m tal que, m veces a es 0. (Tabla anterior. Diapositiva 76) La paridad de un elemento a en el grupo Z64 coincide con la paridad como elemento de Z (Par o Impar). En la siguiente tabla se muestran algunos casos de mutaciones en el VIH. Las mutaciones que están en negrilla aumentan el orden del codón inicial y las que están en cursiva cambian la paridad del codón inicial. 77 78 79 80 Regularidades Importantes Cuando el codon resultante de la mutación aumenta el orden del codon inicial la mutación genera resistencia cruzada. Cuando el codon resultante de la mutación cambia de paridad respecto al codon inicial la mutación genera resistencia cruzada. 81 Invitación La Matemática y la Biología son temas que aunque pareciesen distantes, están profundamente relacionados. El reto ahora es no solo relacionar el conocimiento que ya se tiene sino producir conocimiento a partir de dicha relación. 82 Bibliografía Básica AUBRY, GRÈGORIE. Algebraic Approach to Population Genetics, Ècole Polytechnique Fèdèrale de Lausanne, July 2001. ETHERINGTON I.M.H. Genetic Algebras. Proc. Roy. Soc. Edinburg 59 (1939) 242 – 258. 83 Bibliografía Básica GONSHOR H. Special Train Algebras arising in Genetics. Proc. Edinburg Math. Soc. (2) 14 (1965) 333 – 338. REED, M.; Algebraic structures in genetic inheritance American Mathematical Society. Volume 34, Number 2, April 1997, Pages 107130. 84 Bibliografía Básica SÁNCHEZ ROBERSY Y OTROS. Gene Algebra from a Genetic Code Algebraic Structure, Research Institute of Tropical Roots, Tuber Crops and Banana (INIVIT). Biotechnology Group. Santo Domingo. Villa Clara. Cuba. WÔRZ – BUSEKROS ANGELIKA. Algebras in Genetics, Springer Verlag, Berlin Heidelberg, New York, Lecture Notes in Biomathematics, 36. 1980. 85