# Guía para ejecutar un ejemplo de Trinity: # Crear directorios que

Anuncio
# Guía para ejecutar un ejemplo de Trinity:
# Crear directorios que se van a utilizar.
$ mkdir /media/libre/Ejercicios/Trinity
$ mkdir /media/libre/Ejercicios/Trinity/output
# Acceder al directorio donde se encuentran las secuencias de ejemplo. Explorar las
secuencias (para salir de less apretar la tecla q).
$
$
$
$
$
cd /opt/rnaseq/trinityrnaseq_r20131110/sample_data/test_Trinity_Assembly/
gzip -d reads.left.fq.gz; gzip -d reads.right.fq.gz
less reads.left.fq
head reads.left.fq
head reads.right.fq
# Acceder al directorio dónde se encuentra el programa Trinity.pl
$ cd /opt/rnaseq/trinityrnaseq_r20131110
# Crear las variables que identifican cada secuencia y el output.
$ left=/opt/rnaseq/trinityrnaseq_r20131110/sample_data/test_Trinity_Assembly/reads.left.fq
$ right=/opt/rnaseq/trinityrnaseq_r20131110/sample_data/test_Trinity_Assembly/
reads.right.fq
$ outdir=/media/libre/Ejercicios/Trinity/output
# Ejecutar el programa.
$ perl Trinity.pl --seqType fq --JM 4G --left $left --right $right --output $outdir --CPU
2 --full_cleanup
# Opciones y parámetros utilizados:
# --seqType fq
# --JM 4G
# --left $left
# --right $right
2
# --output $outdir
intermedios)
# --CPU 2
# --full_cleanup
multifasta
##
##
##
##
el tipo de lectura es FASTQ
le otorgamos 4GB de memoria
indicamos cuál es el archivo con las lecturas foward o left o 1
indicamos cuál es el archivo con las lecturas reverseo right o
## dónde queremos que guarde todo el output (muchísimos archivos
## cantidad de cores que le otorgamos
## que borre todos los archivos intermedios, va a generar solo el
# Explorar el archivo multifasta obtenido como resultado (para salir de less apretar la
tecla q)
$ less /media/libre/Ejercicios/Trinity/output.Trinity.fasta
# Sobre el header que genera Trinity:
# Primero hay un código identificador
# comp<NÚMERO> es el identificador numérico del grafo contruido por Chrysalis.
# _c<NÚMERO> es el identificador numérico del componente dentro del grafo.
# seq<NÚMERO> es el identificador numérico de la secuencia extraida del componente
determinado. O sea, la variante de splicing o el parálogo derivado del mismo componente
del grafo.
# Luego len=<NÚMERO> indica el tamaño de la secuencia construida.
# Y path informa sobre la identidad de las lecturas y su posición en la secuencia
reconstruida.
# Acceder al directorio donde se encuentra el programa para obtener estadísticas básicas
que viene incorporado en Trinity.
$ cd util/
# Ejecutar el programa.
$ perl TrinityStats.pl /media/libre/Ejercicios/Trinity/output.Trinity.fasta
# Y listo, ahora lo complicado! (que no lo vamos a ver :/)
# Se pueden alinear las lecturas contra el transcritoma generado por Trinity y
visualizarse con IGV...
# Hacer estimaciones de abundancia (con RSEM)...
# Expresión diferencial con R...
# Blastear...
# Anotación funcional de lo obtenido...
# y MUCHÍSIMAS cosas más...
# ;)
Descargar