Secuenciación de Exoma Costo de diferentes técnicas • Sanger: $10 por fragmento (en las 2 direcciones) – Sólo en gen de la distrofina: $790 • Exoma completo: aprox. $1000 Utilidad • Descubrimiento de alelos raros en enfermedades mendelianas • No se habían descubierto por: – – – Falta de familias (muy pocos enfermos) Penetrancia incompleta Heterogeneidad genética ¿Tiene sentido buscar en el exoma? • Sí: – – – Estudios de mapeo centrados en variantes codificantes han sido exitosos en identificar causas de enfermedades Mayoría de alelos involucrados en enfermedades mendelianas afectan la secuencia codificante Una alta proporción de las variantes que alteran proteína afectan su función y son deletéreas ¿Qué genes se incluyen? • Kits comerciales actuales: – – Todos genes RefSeq Algunas proteínas hipotéticas • No es perfecto: – – No conocemos todos los exones No todos se capturan con la misma eficiencia ¿Cuál es el reto? • Identificar las variantes que causan enfermedad entre las muchas variantes que son polimorfismos o errores de secuenciación Estrategias para identificar variantes causales Filtración discreta -Grupo de afectados emparentados o no emparentados -Busca variantes en el mismo gen en los diferentes afectados -Se descartan variantes “normales” por comparación: -con bases de datos con dbSNP o 1000 Genomes -con controles Supuestos de Filtración discreta -Set de filtración (alelos “normales”) no tiene alelos de individuos con el fenotipo estudiado (no siempre cierto) -Filtración independientemente del MAF (con sólo que esté en los “controles”) correo el riesgo de eliminar variantes patogénicas que tienen frecuencias bajas pero apreciables (ej: alelos recesivos) -Importante que “controles” vengan de la misma Estratificación de candidatos después de filtración discreta Estratificar candidatos por: -Clase funcional: dar más peso a codones de terminación, cambios marco lectura, splicing que a variantes missense. Sobresimplificación -Información funcional del gen -Predicción de que variante tiene efecto funciona. Ejemplo: SIFT, PolyPhen, etc Filtración usando pruebas de asociación -Para variantes candidatas se hacen pruebas casocontrol -Cada vez hay más exomas completos en bases de datos. Se pueden usar miles de cromosomas control -Podría permitir identificar variantes causales aunque los casos sean pocos Modo de herencia y diseño experimental - Información de herencia puede determinar número de individuos a secuenciar. Por ejemplo, se podría identificar una región candidata por ligamiento. Si todos los enfermos comparten el mismo haplotipo se le puede hacer secuenciación de exoma sólo a un afectado - En estos casos la secuenciación del exoma se usa como sustituto de la secuenciación Sanger de los genes candidatos Modo de herencia y diseño experimental - Uso de tríos (padres-hijo): -muy utilizado en casos de novo con enfermedades raras. Papás sanos, hijo enfermo. Se buscan variantes que sean nuevas en el hijo respecto a los padres. -también se puede usar en enfermedades dominantes para seguir la transmisión padre-hijo Modo de herencia y diseño experimental - Para enfermedades recesivas: -la estrategia más simple es filtración discreta -el genoma de un individuo dado tiene 50 veces menor número de variantes nuevas que al teran la proteína en el mismo gen Problemas del método Problemas técnicos - Parte o todo el gen causante no está incluido en análisis (ej: no se sabe que es gen) - La cobertura de la región con la variante causal es baja - La variante causal fue incorrectamente genotipada Problemas en análisis - Dados por limitaciones y supuestos de filtración discreta: -Si hay heterogeneidad genética no va a haber un único gen que presente una variante nueva en todos los afectados -Varios genes podrían tener mutaciones neutras en varios de los casos -Si las dos anteriores son ciertas es imposible separar variantes causales de no causales Problemas en análisis - Existencia de falsos negativos (alelos causales en el grupo “control”) - Existencia de falsos positivos (genes candidatos incorrectos que no se pueden descartar por filtración) - Dificultad de cuantificar la fuerza de los resultados de filtración (ej. valor de p). Se debe a falta de conocimiento acerca de naturaleza y distribución de variación en el genoma. Resumen de estrategias Utilidad en diagnóstico - Cuando es difícil llegar a diagnóstico por criterios clínicos o de laboratorio (ej: síntomas compartidos entre varias enfermedades) - La evaluación es complicada o costosa (ej: cuando hay múltiples genes candidatos,como en Charcot, o varios genes grandes que son evaluados) Retos para el diagnóstico - Secuenciación debe ser más exacta para evitar diagnóstico incorrecto - Algoritmos para anotar las variantes deben ser automatizados - Estrategias para caracterizar el impacto funcional de variantes nuevas y raras deben ser mejoradas. Para determinar la relevancia para el riesgo de enfermedad las nuevas variantes deberán ser comparadas con bases de datos de mutaciones adecuadamente curadas Tarea Ejercicio predicción efecto variantes