Subido por drstephenmouts8

Implicaciones científico-tecnológicas de la bioinformática y sus aplicaciones

1
Implicaciones científico-tecnológicas de la bioinformática y sus aplicaciones
Introducción
No cabe duda de que el tratamiento de la información por medio de herramientas computacionales
facilita el análisis e interpretación de los resultados de los estudios que las han utilizado. En este
sentido, la frase del doctor Morales es acertada: “La más inocente mirada a los datos puede inspirar
una hipótesis” (Sánchez & Martínez, 2018). De lo anterior, se destaca la abrumadora cantidad de
datos que existen en la red y en las bases de datos, lo cual implica que diciplinas como la
bioinformática deban manejar el conocimiento de manera multidisciplinar para el beneficio de la
sociedad.
El tema principal de este ensayo es justamente la informática biomolecular, cuya definición
general se establece a continuación: “La bioinformática es la ciencia que utiliza una combinación
de las tecnologías de la computación, las ciencias de la información y el conocimiento biológico,
para coleccionar, almacenar, analizar, relacionar y modelar datos biológicos.” (Carmen et al.,
2003). De donde resulta interesante que, la invención tecnológica para el manejo de la información
genética (biochips, bases de datos genómicas, sistemas de minería de datos, técnicas de
cuantificación de la expresión génica) están a la vanguardia en el área de investigación biomédica.
En consecuencia, se plantean las siguientes preguntas al respecto: ¿cuáles son los
antecedentes de la bioinformática?, ¿qué escuelas han surgido con el tiempo?, ¿cómo se ha
desarrollado la ciencia a partir de ella? y ¿cuáles son sus aplicaciones?
La cuestión radica en la utilidad de los datos transformados en conocimiento por los
científicos. Por ello, en este documento se describen brevemente los antecedentes históricos más
relevantes; la aportación de Dayhoff en 1925 y el impacto del Proyecto del Genoma Humano.
Además, se presentan las escuelas que engloban los métodos matemáticos, estadísticos y
computacionales para solucionar problemas biológicos usando ADN, ARN e información
relacionada. Al final, se hace una recapitulación de las principales aplicaciones de la bioinformática
y cuáles es su utilidad en el ámbito biomédico.
Con esta confluencia se pretende informar acerca de uno de los campos más útiles en el
análisis y la interpretación de diversos tipos de datos, incluyendo secuencias de nucleótidos y
aminoácidos, dominios de proteínas y estructura de proteínas. A continuación, se resumen los
inicios de la bioinformática y cómo ha llegado a desarrollarse la ciencia sobre lo mencionado
anteriormente.
2
Desarrollo
En primer lugar, conforme a Lahoz (2004), Margaret Oakley Dayhoff (1925-1983) fue una
investigadora en Bioquímica y profesora originaria de Filadelfia (Estados Unidos), quien destacaría
por la creación de las bases de datos donde quedó almacenada la información contenida,
específicamente, de dos tipos de moléculas que son los pilares básicos de la vida: el ADN y las
proteínas. Dicha contribución a la ciencia establecería las bases de lo que a mediados de los años
80 se empieza a conocer como bioinformática.
En segundo lugar, de acuerdo con Coltell et al. (2008), con la comprobación de que el ADN
era la molécula que contenía la información genética, después del establecimiento en 1953 de la
estructura del ADN, y el subsecuente establecimiento del código genético, se solidificaron las bases
para el desarrollo de la era genómica, caracterizada por: técnicas de manipulación del ADN, por el
estudio estructural y funcional de los genes, el análisis comparativo de genomas, la variabilidad
genética, así como la estructura de las proteínas.
Uno de los avances más importantes en relación con el punto anterior fue la finalización en
el año 2000 y publicación en el 2003 de los resultados del Proyecto Genoma Humano (PGH), luego
de 13 años de desarrollo. Desde el principio, la informática ha sido fundamental para el desarrollo
del proyecto, incluso, se señala lo siguiente:
El PGH no tuvo como único objetivo identificar los genes del ADN humano sino también obtener
la secuencia de sus bases. Este proyecto conllevo la generación de bases de datos, a la mejora de los
instrumentos de análisis de datos genómicos, así como la transferencia de tecnologías relacionadas
y el abordaje de las cuestiones éticas, legales y sociales derivadas del proyecto. (Sánchez &
Martínez, 2018; Coltell et al., 2008)
Como se afirma en el párrafo anterior, secuenciar el genoma humano fue posible mediante
la automatización y la computación. Está claro cómo este proyecto impulsó el desarrollo de la
informática biomolecular; “el PGH también mostró las secuencias tanto de intrones como de
exones, lo que ha permitido hacer uso de todos los recursos existentes y desarrollar herramientas
bioinformáticas para reconocer patrones, simulaciones, minería de datos y plataformas
especializadas, entre otros” (Sánchez & Martínez, 2018). No obstante, se observa la falta de un
consenso general entre los profesionales de la bioinformática sobre cuáles son los objetivos y el
ámbito de aplicación de esta diciplina. A continuación, se describen las tres principales escuelas o
enfoques que consolidan el conocimiento en tendencias tecnológicas diversas.
3
Primero, Lahoz (2004) explica que, la escuela formal se caracteriza principalmente por la
búsqueda de una nueva metodología, especialmente en lo referente al concepto de simulación y a
la búsqueda de una nueva síntesis entre la biología y otras diciplinas. Bajo esta síntesis convergen
líneas de investigación como los algoritmos genéticos (Goldberg, 1989), la teoría de autómatas
celulares (Wolfram, 1986), los sistemas de Lindenmayer (Prusinkiewicz y Lindenmayer, 1990),
las redes neuronales artificiales (Freeman y Skapura, 1993) o el estudio y diseño de robots y agentes
autónomos (Maes, 1994) con los que poner a prueba en el mundo real algunos modelos sobre
adaptación biológica y aprendizaje simulados con éxito computacionalmente. Por lo tanto, este
enfoque sintético se basa en los siguientes principios básicos: el concepto de la propiedad
emergente, la modelización de los sistemas biológicos, el concepto del comportamiento global del
sistema a partir de las reglas de la unidad interactiva y la utilización de una estrategia de
modelización de abajo hacia arriba.
Después, la escuela estructural es la que define la bioinformática como: “la aplicación de
los sistemas computacionales en la recogida, almacenamiento y análisis de la información
biológica” (Sobral, 1997, como se citó en Lahoz, 2004). De acuerdo con Lahoz (2004), el término
información biológica hace referencia a las secuencias de proteínas y ácidos nucleicos (ADN y
ARN). Dentro de este enfoque, algunos profesionales dedicados, exclusivamente, al estudio de las
secuencias de ADN sustituyen el término bioinformática por genómica, de manera que su labor se
reduce al análisis, con la ayuda de software especializado, de las secuencias de bases o nucleótidos
que constituyen el genoma de los seres vivos. Por consiguiente, la genómica es una rama o
especialidad de la bioinformática, así como la proteómica, de manera análoga, resulta de aplicar
los sistemas computacionales al estudio del conjunto de proteínas presente en los seres vivos
(proteoma) y que caracterizan su funcionamiento.
En este sentido, una vez concluidas en el Proyecto Genoma Humano la fase de
secuenciación, es decir, la identificación de las bases o nucleótidos del genoma, y la fase de
ensamblaje o unión de los fragmentos secuenciados procedentes de los cromosomas en su orden
original, la bioinformática se encuentra en la fase de anotación, la cual consiste en completar el
estudio del genoma humano identificando en la secuencia dónde están los genes y cuál es su
función. Esto conduce a la genómica a una etapa conocida como postgenómica, lo cual corrobora
lo mencionado por Gershon (1997, como se citó en Lahoz, 2004).
4
En un contexto en el que el PGH hace de la genómica la especialidad de la bioinformática
con mayor impacto tanto científico como social, la proteómica mantiene como problema central de
estudio el relativo a la predicción de la estructura tridimensional en las proteínas, también conocido
como problema del plegamiento. El problema cosiste en predecir, aplicando métodos
computacionales, cómo se plegará una proteína conocida su secuencia de aminoácidos. Su
importancia es tal porque la función biológica de una proteína depende de su estructura
tridimensional, lo cual corrobora lo mencionado por Lahoz (2004).
Según Lahoz (2004), los problemas más característicos estudiados por la genómica y la
proteómica son: la búsqueda de patrones en proteínas y ADN, la predicción de la estructura
tridimensional de las proteínas y el almacenamiento y búsqueda de las secuencias de proteínas y
ácido nucleicos en bases de datos.
Por último, la escuela instrumental enfoca a la bioinformática como: “la aplicación de los
ordenadores a la gestión de información biológica” (Robbins, 1996, como se citó en Lahoz, 2004).
Por ende, el término información biológica tiene un propósito general en comparación con el
ámbito de la escuela estructural. Las investigaciones parten de la terminología científica propia de
cualquiera de las especialidades de la biología, por ejemplo, vocablos como especie, clon,
ecosistema, entre otros. Los problemas más característicos estudiados dentro de esta escuela son
todos aquellos relacionados con la infraestructura que soporta la información. Algunas cuestiones
de interés al respecto tratan sobre: la organización coherente de los datos, la sintaxis común
(lenguaje HTML, por ejemplo), el diseño de portales que faciliten la búsqueda de información
relacionada, y la interdependencia y conectividad de los sistemas computacionales.
Prosiguiendo con el análisis, los avances que se han producido en el conocimiento del
genoma humano han tenido y van a tener en los próximos años un gran impacto tanto en
biomedicina, como en las ciencias de la computación, sobre todo en el ámbito de la informática
aplicada a la integración de la información genómica en la investigación epidemiológica
tradicional, lo cual corrobora lo mencionado por Coltell et al. (2008).
A lo largo de este texto se han expuesto diversas aplicaciones de la bioinformática. Ahora
bien, de acuerdo con Coltell et al. (2008), a raíz de los nuevos enfoques derivados de la genómica
y la postgenómica, resultará difícil concebir la investigación y práctica de la medicina si no es
integrando la información genética, proteómica y otras disciplinas relacionadas, bajo el sufijo
común de ómicas, con los datos clínicos.
5
Se espera una considerable repercusión de la aplicación de la informática en la
investigación, así como su aplicación en el campo de la medicina. Se demanda, por tanto, cada día
más, programas diseñados específicamente para integrar los resultados de distintas procedencias
(secuenciación del ADN, genotipado, microarrays, bases de datos hospitalarias, entre otros).
Coltell et al. (2008) mencionan que, las principales aplicaciones de la bioinformática son la
gestión, la simulación, la minería de datos y el análisis de la información generada en el PGH, con
aplicación también en la predicción de estructuras proteicas, estudios de secuencias y otras
actividades derivadas de la investigación en biología. El término simulación hace referencia a la
experimentación con un modelo a partir de una hipótesis de trabajo, para comprender la estructura
íntima del sistema o realizar una predicción. Por minería de datos se entiende el conjunto de
técnicas para la inducción de conocimiento útil a partir de masas ingentes de datos.
Por otro lado, según Kanehisa y Bork (2003, como se citó en Sánchez & Martínez, 2018),
una aplicación más de la bioinformática es la posibilidad de predecir el comportamiento de sistemas
de gran complejidad, como las redes de interacción de proteínas en los procesos celulares y la
determinación del fenotipo de los organismos. Con esta información se espera entender de manera
integral todos los sistemas biológicos.
En relación con la proteómica previamente mencionada, conforme a Sánchez & Martínez,
2018), la bioinformática ha contribuido a la detección de modificaciones sutiles en los patrones de
expresión y a la obtención de nuevos biomarcadores. Asimismo, la bioinformática ha coadyuvado
identificar blancos terapéuticos, lo que ha conducido al diseño de nuevos ensayos clínicos usando
nuevas estrategias terapéuticas.
Finalmente, según Kanehisa (2003, como se citó en Coltell et al., 2008), el avance que ha
supuesto la bioinformática en el desarrollo de la genética y de las ciencias de la salud ha dado lugar
a la posibilidad del estudio de la secuencia y estructura de proteínas, de genes (mutaciones,
polimorfismos, comparación de secuencias, etc.), y al desarrollo de microarrays y de la
espectrometría de masas. Estas dos últimas se aplican, respectivamente, para el análisis sistemático
de la expresión de genes y la detección de la interacción entre proteínas. Toda esta información,
accesible en Internet, ha transformado las bases de datos y su modo de acceso, y debería permitir
a los bioinformáticos clínicos aplicarla en la práctica médica, a través de un enfoque nuevo en el
tratamiento de enfermedades en lo que se denomina medicina individualizada, lo que corrobora lo
mencionado por Maoio y Musen (2003, 2002, como se citaron en Coltell et al., 2008).
6
Conclusiones
No cabe duda del gran beneficio que las ciencias de la salud y biológicas han obtenido con el
desarrollo de la bioinformática y su aplicación en el conocimiento acerca del genoma humano. Así
pues, en la atención a la salud se prevé que el uso de la tecnología de microarrays sea de gran
utilidad al momento de resolver los problemas relacionados con el análisis estadístico e
interpretación de los resultados, así como la subsecuente incorporación metodológica de estos
resultados en la historia clínica.
También, con respecto a la proteómica, se plantea el reto de utilizar enormes conjuntos de
datos de origen heterogéneo y reforzar la generación de conocimiento, mediante el desarrollo y
aplicación de grandes plataformas bioinformáticas que asumen las funciones de sistemas de gestión
de datos y bases de datos de conocimiento. En la farmacología, la bioinformática clínica ha sido
importante para identificar dianas terapéuticas, diseñar ensayos clínicos y desarrollar
biomarcadores.
Si bien parece que ésta sea una estrategia a largo plazo, la bioinformática clínica ha sido y
será muy importante para el área biomédica. Entre otras áreas, se ha aplicado ya en la detección
temprana y tratamiento de enfermedades oncológicas, así como en la identificación y reducción de
riesgos y prevención de estas enfermedades. Esto ha sido posible gracias a que en la investigación
se ha podido integrar la información obtenida a partir de la búsqueda en bases de datos en línea de
secuencias genéticas, de proteínas, mutaciones, referencias bibliográficas y redes de regulación
génica y rutas metabólicas, lo cual corrobora lo mencionado por Coltell et al. (2008).
Entender el alcance de la bioinformática se consigue leyendo los numerosos artículos que
se tienen al respecto, ya que en la mayoría de ellos se describen predicciones y futuras aportaciones.
Si se quiere profundizar más en el tema, es recomendable buscar fuentes de información
relacionadas con el modelado electrónico y atómico de proteínas, genómica computacional,
bioinformática estructural, biología de sistemas, entre otros.
El reto para las futuras líneas de investigación será integrar los resultados genómicos con
otra clase de información, por ejemplo, genes para combatir el cambio climático (interacción genambiente) y estimular probabilidades de aplicar la bioinformática clínica a la medicina
personalizada.
7
Referencias
Báez Pérez, E., Alemán Lage, M., Fernández Morín, J., & Morales Rigau, J. (2003).
Bioinformática: Algunos retos filosóficos, sociales, éticos y jurídicos. Revista med electrón,
25(2).
Recuperado
el
11
de
mayo
de
2020,
de
http://www.revmatanzas.sld.cu/revista%20medica/ano%202003/vol2%202003/revmed%2
02003%20vol2.htm
Coltell, Ó., Arregui, M., Fabregat, A., & Portolés, O. (mayo de 2008). La bioinformática en la
práctica médica: Integración de datos biológicos y clínicos. Revista Médica de Chile,
136(5), 645-652. doi:10.4067/S0034-98872008000500015
Lahoz-Beltrá, R. (2004). Bioinformática: simulación, vida artificial e inteligencia artificial.
Madrid:
Díaz
de
Santos.
Recuperado
el
11
de
mayo
de
2020,
de
https://books.google.com.mx/books?id=U4pwetEPmpQC&printsec=frontcover&dq=bioin
form%C3%A1tica&hl=en&sa=X&ved=0ahUKEwi3uP6ArLLpAhUSLa0KHeloD_QQ6A
EIKzAA#v=onepage&q&f=true
Sánchez Mendiola, M., & Martínez Franco, A. (2018). Informática Biomédica (3 ed.). Ciudad de
México: Elsevier. ISBN:978-607-30-0275-2