Clase 9- Secuenciacion de Exoma

Anuncio
Secuenciación de Exoma
Costo de diferentes técnicas
• Sanger: $10 por fragmento (en las 2 direcciones)
–
Sólo en gen de la distrofina: $790
• Exoma completo: aprox. $1000
Utilidad
• Descubrimiento de alelos raros en enfermedades
mendelianas
• No se habían descubierto por:
–
–
–
Falta de familias (muy pocos enfermos)
Penetrancia incompleta
Heterogeneidad genética
¿Tiene sentido buscar en el exoma?
• Sí:
–
–
–
Estudios de mapeo centrados en variantes
codificantes han sido exitosos en
identificar causas de enfermedades
Mayoría de alelos involucrados en
enfermedades mendelianas afectan la
secuencia codificante
Una alta proporción de las variantes que
alteran proteína afectan su función y son
deletéreas
¿Qué genes se incluyen?
• Kits comerciales actuales:
–
–
Todos genes RefSeq
Algunas proteínas hipotéticas
• No es perfecto:
–
–
No conocemos todos los exones
No todos se capturan con la misma
eficiencia
¿Cuál es el reto?
• Identificar las variantes que causan enfermedad
entre las muchas variantes que son polimorfismos
o errores de secuenciación
Estrategias para identificar
variantes causales
Filtración discreta
-Grupo de afectados emparentados o no
emparentados
-Busca variantes en el mismo gen en los diferentes
afectados
-Se descartan variantes “normales” por
comparación:
-con bases de datos con dbSNP o 1000 Genomes
-con controles
Supuestos de Filtración discreta
-Set de filtración (alelos “normales”) no tiene
alelos de individuos con el fenotipo estudiado
(no siempre cierto)
-Filtración independientemente del MAF (con sólo
que esté en los “controles”) correo el riesgo de
eliminar variantes patogénicas que tienen
frecuencias bajas pero apreciables (ej: alelos
recesivos)
-Importante que “controles” vengan de la misma
Estratificación de candidatos después
de filtración discreta
Estratificar candidatos por:
-Clase funcional: dar más peso a codones de
terminación, cambios marco lectura, splicing que
a variantes missense. Sobresimplificación
-Información funcional del gen
-Predicción de que variante tiene efecto funciona.
Ejemplo: SIFT, PolyPhen, etc
Filtración usando pruebas de
asociación
-Para variantes candidatas se hacen pruebas casocontrol
-Cada vez hay más exomas completos en bases de
datos. Se pueden usar miles de cromosomas
control
-Podría permitir identificar variantes causales
aunque los casos sean pocos
Modo de herencia y diseño
experimental
- Información de herencia puede determinar
número de individuos a secuenciar. Por ejemplo,
se podría identificar una región candidata por
ligamiento. Si todos los enfermos comparten el
mismo haplotipo se le puede hacer secuenciación
de exoma sólo a un afectado
- En estos casos la secuenciación del exoma se usa
como sustituto de la secuenciación Sanger de los
genes candidatos
Modo de herencia y diseño
experimental
- Uso de tríos (padres-hijo):
-muy utilizado en casos de novo con enfermedades
raras. Papás sanos, hijo enfermo. Se buscan
variantes que sean nuevas en el hijo respecto a los
padres.
-también se puede usar en enfermedades
dominantes para seguir la transmisión padre-hijo
Modo de herencia y diseño
experimental
- Para enfermedades recesivas:
-la estrategia más simple es filtración discreta
-el genoma de un individuo dado tiene 50 veces
menor número de variantes nuevas que al teran la
proteína en el mismo gen
Problemas del método
Problemas técnicos
- Parte o todo el gen causante no está incluido en
análisis (ej: no se sabe que es gen)
- La cobertura de la región con la variante causal es
baja
- La variante causal fue incorrectamente
genotipada
Problemas en análisis
- Dados por limitaciones y supuestos de filtración
discreta:
-Si hay heterogeneidad genética no va a haber un
único gen que presente una variante nueva en
todos los afectados
-Varios genes podrían tener mutaciones neutras en
varios de los casos
-Si las dos anteriores son ciertas es imposible
separar variantes causales de no causales
Problemas en análisis
- Existencia de falsos negativos (alelos causales en
el grupo “control”)
- Existencia de falsos positivos (genes candidatos
incorrectos que no se pueden descartar por
filtración)
- Dificultad de cuantificar la fuerza de los
resultados de filtración (ej. valor de p). Se debe a
falta de conocimiento acerca de naturaleza y
distribución de variación en el genoma.
Resumen de estrategias
Utilidad en diagnóstico
- Cuando es difícil llegar a diagnóstico por criterios
clínicos o de laboratorio (ej: síntomas
compartidos entre varias enfermedades)
- La evaluación es complicada o costosa (ej: cuando
hay múltiples genes candidatos,como en
Charcot, o varios genes grandes que son
evaluados)
Retos para el diagnóstico
- Secuenciación debe ser más exacta para evitar
diagnóstico incorrecto
- Algoritmos para anotar las variantes deben ser
automatizados
- Estrategias para caracterizar el impacto funcional
de variantes nuevas y raras deben ser mejoradas.
Para determinar la relevancia para el riesgo de
enfermedad las nuevas variantes deberán ser
comparadas con bases de datos de mutaciones
adecuadamente curadas
Tarea
Ejercicio predicción efecto variantes
Descargar