TP_bioinformatica 2013.pdf

Anuncio
TP Bioinformática
Autores: Máximo Rivarola, Ana Julia Distéfano, Paula Fernández, Norma Paniego,
Sergio González
Tutorial bases de datos
1) Uso de Entrez
a) Utilizando Entrez, encuentra cuantos genes humanos tienen un dominio WAP
Tipear human [orgn] AND WAP domain (23 entradas)
b) Acotar la búsqueda para encontrar cuantas proteínas con este tipo de dominio
están localizadas en el cromosoma 20.
Usar el buscador en la página principal de Entrez y tipear: 20 [chromosome] or [chr]
AND human [organism] or [orgn] and WAP domain. Hay 16 entradas clasificadas
como genes.
2) Estamos trabajando con el cDNA AF217525. Utiliza Entrez para obtener la secuencia
FASTA y encontrar la siguiente información:
a) ¿Cuál gen está codificado por este cDNA? DSCAM gene, mol de adhesión en
Síndrome de Down
b) ¿Cuántos aminoácidos tiene la traducción? 2012 aa AF217525_1
c) ¿Cuáles son los IDs de cada posible gen o unigen y confirmar si el gen fue manual
o automáticamente curado (NM o XM)? NM001389, NM indica que fue curado
manualmente.
d) ¿Qué dominios Pfam contiene la proteína? Para ver el dominio en Entrez
clickear en el link del dominio conservado bajo la proteína refseq
(pfam07679)
e) Utilizando NCBI, ejecute un Blast con la secuencia RefSeq NM001389 contra la
base de datos human + mouse ¿Por qué no se obtiene 100% de identidad?
¿Cambia el resultado si se aplica el low complexity filter? La secuencia
NM001389 presenta una identidad del 99% porque presenta un gap en el
alineamiento. En parámetros de BLAST, destildar “mask look table only” y
probar con y sin filtro.
Descargar