PROPUESTAS PARA BIOINFORMÁTICA En función del desarrollo del proyecto de ESTs, de la posibilidad de la puesta en marcha de un Proyecto Genoma de Cítricos y de las limitaciones del centro para adquirir material informático, podemos aspirar a diferentes niveles de equipamiento y “sofisticación”: Opción básica: se puede realizar una informática básica con lo que tenemos ahora, un PC e internet. El ensamblaje de las secuencias, búsquedas de similitudes, etc, se pueden realizar en servidores de internet que proveen de estas herramientas. La base de datos de secuencias se puede realizar en Access. Esta opción sería válida para un proyecto de ESTs con unos pocos miles de ESTs. VENTAJAS: con lo que tenemos podemos funcionar DESVENTAJAS: herramientas limitadas, dependemos de las herramientas de la web Opción Intermedia: podemos dedicar un PC con Linux a la bioinformática, ya que la mayor parte de paquetes de análisis están compilados en este sistema. En este ordenador se realizarían los ensamblajes de secuencias y otras muchas aplicaciones, además se podría realizar la base de datos de secuencias en SQL, que es mucho más potente. VENTAJAS: con un PC es suficiente, los programas son gratuitos, la base de datos sería más potente DESVENTAJAS: con varios usuarios conectados sería todo muy lento, tendríamos que convencer al Servicio de Informática de la necesidad del Linux. Yo no lo he manejado nunca, tendría que estudiar este sistema. Los programas trabajan en entorno X-windows, haría falta poner simuladores X-win en los PC para poder conectarse al PC, o habría que trabajar directamente en ese PC. Opción Avanzada: consistiría en comprar un Servidor que diera servicio de bioinformática a todos los usuarios del edificio de Genómica o del IVIA. Este servidor funcionaría en Linux o Unix, y podría disponer de los programas más potentes de análisis de secuencias. Permitiría la conexión de usuarios múltiples sin problemas. VENTAJAS: tiene potencia de cálculo suficiente para soportar un proyecto genoma completo y múltiples usuarios. Las mismas que la opción intermedia. DESVENTAJAS: el precio, nos plantamos en 4 o 5 mil €, hace falta un informático que controle el equipo, haga copias de seguridad, etc. . Los programas trabajan en entorno X-windows, haría falta poner simuladores X-win en los PC para poder conectarse al servidor para trabajar con esos programas. Opción externa 1: podríamos hacernos usuarios del Servicio de Bioinformática de la Universidad de Valencia, para poder usar los programas que allí tienen, la cuota no es muy cara, aunque la base de datos de secuencias sería cosa nuestra, con lo que el problema no se soluciona del todo. Opción externa 2: contratar la base de datos con Sistemas Genómicos. Disponen de una base de datos SQL muy buena, cualquier usuario del grupo podría conectarse sin problemas, permite hacer BLAST sobre las secuencias propias o sobre las del GenBank. APORTACIÓN AL PROYECTO DE GENÓMICA FUNCIONAL Análisis de ESTs: Ensamblaje, obtención de consensos, búsqueda de similitudes más significativas. Base de datos: a partir de la información generada en el análisis, realización de una base de datos en Access que pueda servir de referencia para la búsqueda de genes de interés y para el diseño de los chips de ADN. Proporcionar una base de datos local y las herramientas que permitan hacer BLAST sobre nuestras secuencias. Caracterización completa de cDNAs. Para secuenciar por completo un cDNA de interés: diseño de primers, ensamblaje de lecturas y corrección de consensos. Para la caracterización de la secuencia: obtención de la ORF, predicción de la proteína, búsqueda de similitudes, búsqueda de patrones conservados. Búsqueda de bibliográfia sobre proteinas similares ya descritas. Análisis comparativo/funcional: si existen otras proteínas similares en las bases de datos, le realización de un estudio comparativo (clustal) puede ayudar a identificar motivos funcionales conservados en las secuencias procedentes de diferentes especies. Posibilidad de hacer un análisis filogenético.