bajar Trabajo Practico II

Anuncio
Biofísica
Trabajo Práctico # 2
Breve introducción a Linux
El Software para Dinámica Molecular (DM) esta basado en una interfaz operada por linea de comando en una
computadora con Linux, por lo que antes de comenzar con el TP2 se verá una introducción al mundo Linux.
Para comenzar abra una Terminal de Linux (un atajo: Ctrl+Alt+T).
En la mayoría de las computadoras con Linux, la terminal se verá más o menos así:
Figura 1: Terminal de Linux – Distribución Ubuntu.
La mayoría del trabajo en este TP será realizado utilizando la Terminal.
Note que el símbolo “$” es el prompt en la linea de comando de la terminal.
Listar archivos y crear directorios (carpetas)
Cuando uno abre una terminal y comienza a trabajar, el directorio en el que se encuentra es el directorio llamado raíz
(root, por su nombre en inglés). Tiene el mismo nombre que el “nombre de usuario”, y es donde se almacenan los
archivos y directorios. En la imagen superior, el directorio raíz es: /home/marcos
ls (list)
El comando ls (list, o listar en castellano) sirve para que la computadora devuelva una lista con todo lo que se halla en
el directorio en el que uno se encuentra. Para ejecutarlo, escriba “ls” en la terminal y luego oprima Enter.
$ ls
La terminal listará el conjunto de elementos presentes en el home.
mkdir (make directory)
Para este TP será necesario crear una nueva carpeta donde alojar los archivos y carpetas del mismo. Utilizando el
comando “mkdir” cree un directorio llamado “tp2”.
$ mkdir tp2
si ahora se hace un ls se debería observar el directorio creado.
cd (change directory)
Ahora utilizando el comando “cd” entre al directorio recién creado.
$ cd tp2
$ ls
Si desea ir un directorio atrás, es decir ir al directorio “padre” del actual, puede hacerlo mediante el comando “cd ..”.
$ cd ..
Por otro lado, si desea ir directamente al directorio raíz puede hacerlo mediante el comando “cd” por si mismo, o bien
“cd ~”, ambos llevan al directorio home.
$ cd
$ cd ~
pwd (print working directory)
El pathname o, de modo más corto path, describe en que directorio se encuentra uno en relación al sistema de archivos
de la computadora. Imprima el directorio en el que está trabajando actualmente mediante el comando en cuestión:
$ pwd
Preparación del archivo de topología y
del archivo de coordenadas
Biofísica: Trabajo Práctico N° 2 – Sebastián Fernández Alberti / Marcos Grosso – Página 1 de 18
Para este trabajo práctico, utilizando el programa preparatorio tLEaP, se construirá un péptido de di Alanina (Figura 2).
Con el, se correrá luego una simulación de dinámica molecular mediante AMBER (AMBER es el acrónimo de Assisted
Model Building and Energy Refinement).
Figura 2: Péptido de di Alanina.
A fin de construir y solvatar esta molécula, usted tendrá que iniciar el tLEaP. El tLEaP se maneja a través de linea de
comandos. Mediante éste programa se construirá el archivo de topología del sistema, y se definirán parámetros para la
molécula.
A continuación se le indicará los pasos para entrar al mismo:



abra una terminal de Linux
escriba: ssh [email protected] y oprima Enter
es posible que la máquina le solicite confirmación de acceso, esto sucede si es la primera vez que se accede al
Cluster desde dicha computadora. Para darle la confirmación escriba yes y luego oprima Enter
a continuación, el Cluster le pedirá la contraseña, escriba: biofisica y luego Enter
una vez que haya ingresado, utilizando lo visto anteriormente, cree una carpeta llamada tp2_nombre cambiando
la palabra “nombre” por su nombre de pila, luego entre en ella.


Carga de un campo de fuerza para proteínas y ácidos nucleicos
En el contexto de Dinámica Molecular, un campo de fuerza es la función de energía potencial que incluye los distintos
parámetros que describen las interacciones inter- e intra- moleculares.
Ecuación 1: forma básica de la energía potencial utilizado por AMBER.
El campo de fuerza de AMBER que utilizará en el presente trabajo práctico se denomina ff99SB. El mismo fue
diseñado para ser utilizado tanto con ácidos nucleicos como con proteínas.
----------------------------------------------------------------------Antes de comenzar a utilizar el tLEaP, algunas aclaraciones:



Desactive el Num Lock (es decir el teclado numérico).
Cada vez que ejecute un comando en el tLEaP, lea el texto impreso en la pantalla. En caso de aparecer un
mensaje de “Warning” o “Error” pida la asistencia del instructor, no ignore esta advertencia, el mínimo
inconveniente pasado por alto en la preparación de los archivos hará fracasar la dinámica molecular.
Lea el instructivo completo hasta encontrarse con una línea divisoria como la que observa sobre este texto,
Resalte los comandos que serán ingresados en el tLEaP, son aquellos que aparecen luego del símbolo “>”.
Esto, es importante porque la comunicación con el tLEaP debe ser fluida.
Chequee que se encuentra en la carpeta indicada. En la terminal de Linux que posee abierta, donde ha creado y entrado
a la carpeta ha ser utilizada en el presente TP, ejecute el comando pwd (print working directory), éste comando le dirá
exactamente en que directorio se encuentra (Nota 1).
Nota 1: ejecutar un comando significa escribirlo en la Terminal y luego oprimir la tecla Enter.
Biofísica: Trabajo Práctico N° 2 – Sebastián Fernández Alberti / Marcos Grosso – Página 2 de 18
Ejecute el comando: tleap (Nota 2)
> tleap
Nota 2: en el tLEaP el prompt dejó de ser: “$”, para pasar a ser: “>”.
En la misma Terminal donde ejecutó el comando, se abrirá el programa preparatorio tLEaP (Figura 3).
Figura 3: Terminal donde se ha ejecutado el programa preparatorio tLEaP.
A continuación, el campo de fuerza ff99SB será cargado al tLEaP mediante el comando source
> source leaprc.ff99SB
Construcción de un péptido de di alanina
Usted puede construir un péptido de di alanina como un aminoácido de alanina que posea un grupo acetilo unido a su
extremo N-terminal, y una n-metilamida en el C-terminal. Dado que se ha cargado el campo de fuerza ff99SB, tLEaP
posee ahora éstas “unidades” disponibles para que usted pueda construir el di péptido. La secuencia de comandos que se
le indican a continuación creará una nueva unidad a partir del ensamblado de las anteriores,
Utilice el comando sequence para crear una nueva unidad llamada di-ala a partir de las undiades ACE, ALA, y NME.
> di-ala = sequence { ACE ALA NME }
Ahora, usted posee un di péptido de alanina guardado en la unidad di-ala.
Guardado del archivo de topología y del archivo de coordenadas
Ahora, usted guardará el archivo de topología y el archivo de coordenadas. A veces se denomina a estos archivos como
prmtop y inpcrd respectivamente, es común encontrar esta nomenclatura en los tutoriales (o en la lista de e-mails de
consulta) desarrollados por AMBER.
En el caso del presente trabajo práctico, los archivos en cuestión serán nombrados según una lógica que indicará: el
nombre de la unidad con la que se está trabajando (di-ala), y en que etapa de la preparación fueron guardados (en vacío
o con solvente); llevando el archivo de topología la extensión “.top” y el de coordenadas la extensión “.crd”.
En las etapas subsiguientes se agregarán al sistema moléculas de agua (y contraiones, si fueren necesarios). Hasta aquí
la molécula está en vacío. La experiencia práctica indica que es conveniente generar el archivo de topología y el de
coordenadas para éstas condiciones.
Genérelos utilizando el comando saveAmberParm (Nota 3)
> saveAmberParm di-ala di-ala_vacio.top di-ala_vacio.crd
Nota 3: las mayúsculas no son necesarias en el comando saveAmberParm, sencillamente ayudan a escribir el comando
sin omitir letras.
La salida del tLEaP luego de ejecutar el comando saveAmberParm se verá como la Figura 4.
Solvatado del di péptido de alanina
El próximo paso en la preparación de este sistema es el solvatado de la molécula con agua explícita. Es decir, se rodeará
al di péptido de alanina con una caja de moléculas de agua, con las cuales la di alanina podrá interactuar.
Existen diferentes tipos de caja de agua que pueden ser utilizados en AMBER, en el presente trabajo práctico se
utilizará el modelo llamado TIP3P.
Biofísica: Trabajo Práctico N° 2 – Sebastián Fernández Alberti / Marcos Grosso – Página 3 de 18
Figura 4: Terminal donde se ha ejecutado el comando saveAmberParm.
En este tipo de simulación, el sistema posee condiciones periódicas de contorno (Figura 5). Esto significa que las
moléculas que salgan por una cara de la caja, entrarán por el otro extremo. Es importante que la caja sea lo
suficientemente larga como para las diferentes moléculas de di alanina no interaccionen consigo mismas. Esto se
consiguen colocando suficientes moléculas de agua rodeando al di péptido.
Figura 5: Condiciones Periódicas de Contorno.
Utilice el comando solvateBox para solvatar el sistema
> solvateBox di-ala TIP3PBOX 10.0
TIP3PBOX especifica el tipo de caja de agua a utilizar. El valor 10.0 indica que, entre el di péptido y la pared de la caja
de agua, habrá un buffer de al menos 10 Angstroms de largo. Note que cada caja periódica posee seis caras, y esta
condición ha de cumplirse para cada una de las caras (Figura 4).
Observe la información presente en la salida del tLEaP luego de ejecutar el comando solvateBox, será como la Figura 6.
Figura 6: Terminal donde se ha ejecutado el comando solvateBox.
Compensación de cargas
En este caso particular no es necesario compensar las cargas de la molécula con la que se está trabajando, dado que la
misma posee carga neta cero. No siempre es éste el caso, cuando es necesario compensar una carga negativa el tLEaP lo
hace agregando un Na+. Por otro lado, si se necesita compensar una carga positiva se utiliza un Cl-.
Ambas operaciones se hacen utilizando el comando addIons
> addIons di-ala Na+ 0
o
Biofísica: Trabajo Práctico N° 2 – Sebastián Fernández Alberti / Marcos Grosso – Página 4 de 18
> addIons di-ala Cl- 0
Aquí el 0 indica que la carga neta deseada es la carga neutra. El tLEaP agregará tantos átomos de sodio -o cloro- como
cargas negativas -o positivas- tenga que compensar.
Guardado del archivo de topología y del archivo de coordenadas
Llegada esta etapa de la preparación, la unidad llamada di-ala ahora contiene: el péptido de di alanina, moléculas de
agua, y la información sobre la caja periódica necesarias para la simulación. Todos los parámetros fueron asignados a
partir del campo de fuerza ff99SB.
Genere los archivos de topología y coordenadas, como hizo anteriormente, utilizando el comando saveAmberParm
(Nota 3)
> saveAmberParm di-ala di-ala_sol.top di-ala_sol.crd
Como se mencionó dos páginas más arriba, en ocasión de guardar los archivos en vacío, note como los nombres dan
cuenta de que el di péptido está en solvente.
Cerrado de tLEaP
Cierre el tLEaP ejecutando el comando quit
> quit
En este punto del TP usted posee resaltados todos los comandos que debe ingresar en el tLEaP de modo secuencial.
Recuerde que es importante leer el texto impreso en la pantalla luego de que ejecuta un comando en el tLEaP. En caso
de aparecer un mensaje de “Warning” o “Error” pida la asistencia del instructor, no ignore esta advertencia, el mínimo
inconveniente pasado por alto en la preparación de los archivos hará fracasar la dinámica molecular.
Abra el tLEaP y genere los archivos.
Ejecute el comando ls
$ ls
observará que se han creado los archivos que usted generó más uno extra llamado leap.log. Si desea puede verlo usando
el vi
$ vi leap.log
para salir
escriba “:” y “q!”, luego oprima Enter.
La “q” seguida del símbolo “!” le indica al vi que salga sin guardar los cambios.
Preparación de los archivos input para Sander
El último componente necesario es el archivo input, este define los settings para cada corrida de dinámica molecular,
Para este sistema se correrá una minimización de energía, un calentamiento lento, y luego una producción de dinámica
molecular a la temperatura y presión deseadas.
 Minimización
 Calentamiento a volumen y temperatura constante (NVT) por 20ps desde 0K hasta 300K.
 Producción de Dinámica Molecular a presión y temperatura constante (NPT) a 1atm y 300K por 60ps.
Se guardará la trayectoria de la dinámica cada 2ps. La temperatura se controlará a través del termostato de Langevin.
Para controlar todos los settings usted escribirá un input sencillo mediante el editor vi
$ vi 01_Min.in
luego oprima la tecla “i” esto le permitirá escribir. Escriba la siguiente lista de settings:
Minimize
&cntrl
imin=1,
ntx=1,
irest=0,
maxcyc=2000,
ncyc=1000,
ntpr=100,
ntwx=0,
cut=8.0,
/
una vez escrita la serie de comandos, presione la tecla Esc, luego escriba “:” y “wq”, luego oprima Enter.
Biofísica: Trabajo Práctico N° 2 – Sebastián Fernández Alberti / Marcos Grosso – Página 5 de 18
“wq” le indica al vi que guarde los cambios y luego salga.
Estos settings pueden resumirse del siguiente modo:
imin=1
ntx=1
irest=0
maxcyc=2000
ncyc=1000
ntpr=100
ntwx=0
cut=8.0
La corrida será una minimización.
Leer coordenadas pero no velocidades en formato ASCII a partir del archivo inpcrd.
No reiniciar la simulación. (Esto no aplica a la minimización)
Número máximo de ciclos de minimización
Utilizar el algoritmo de pasos descendientes (steepest descent algorithm) para los primeros ncyc
ciclos, luego utilizar el algoritmo de gradiente conjugado (conjugate gradient algorithm) para los
maxcyc-ncyc pasos restantes.
Imprimir en el archivo de salida (con
extensión .out) cada ntpr ciclos.
No escribir archivo de trayectoria. (Esto no aplica a la minimización)
Distancia de cutoff no enlazante, en Angstroms.
Input para el Calentamiento
A continuación se generará el input para el calentamiento. Como ha hecho para el caso anterior, escriba el input
utilizando el vi
$ vi 02_Heat.in
con los siguientes settings:
Heat
&cntrl
imin=0,
ntx=1,
irest=0,
nstlim=10000,
dt=0.002,
ntf=2,
ntc=2,
tempi=0.0,
temp0=300.0,
ntpr=100,
ntwx=100,
cut=8.0,
ntb=1,
ntp=0,
ntt=3,
gamma_ln=2.0,
nmropt=1,
ig=-1,
/
&wt type='TEMP0', istep1=0, istep2=9000, value1=0.0, value2=300.0 /
&wt type='TEMP0', istep1=9001, istep2=10000, value1=300.0, value2=300.0 /
&wt type='END' /
una vez escrita la serie de comandos, presione la tecla Esc, luego escriba “:” y “wq”, por último oprima Enter.
“wq” le indica al vi que guarde los cambios y luego salga.
Estos settings pueden resumirse del siguiente modo:
imin=0
nstlim=10000
dt=0.002
ntc=2
ntf=2
tempi=0.0
temp0=300.0
ntwx=1000
ntb=1
ntp=0
La corrida será una dinámica molecular.
Número de pasos de la dinámica.
Tiempo del paso de integración en picosegundos (ps). (nstlim * dt = duración de la dinámica en ps).
Activar SHAKE para restringir todos los enlaces que incluyen un hidrógeno. El enlace será
considerado como rígido, no vibrará.
No calcular las fuerzas para los enlaces restringidos bajo SHAKE.
Temperatura inicial del termostato, en K.
Temperatura final del termostato, en K.
Escribir en el archivo de trayectoria las coordenadas del sistema cada ntwx pasos.
Activar las condiciones periódicas de contorno con volumen constante.
No utilizar control de la presión.
Biofísica: Trabajo Práctico N° 2 – Sebastián Fernández Alberti / Marcos Grosso – Página 6 de 18
ntt=3
gamma_ln=2.0
nmropt=1
ig=-1
Seleccionar el termostato de Langevin para controlar la temperatura.
Frecuencia de coalición del termostato de Langevin.
Leer restricciones de NMR y cambios de peso. (ver sección NMROPT)
Hacer aleatorio la semilla para el generador de números pseudo-aleatorios.
Temperatura del termostato vía NMROPT
Las tres líneas finales le permiten al termostato cambiar su temperatura durante la simulación. Durante los primeros
9000 pasos, la temperatura se irá incrementando desde 0K hasta 300K. Desde el paso 9001 hasta el paso 10000, la
misma permanecerá a 300K.
Input para la Producción
Es importante mencionar que el input que se generará para la producción no es propiamente un input para correr
dinámica en general. Los valores de ntpr y ntwx elegidos para este trabajo práctico son muy pequeños comparados con
los que se utilizan comúnmente en DM. Por esta razón, la dinámica tardará un tiempo razonable de modo de que usted
pueda analizar los resultados de la misma.
Utilizando vi genere el input para la producción, con los settings que se le indican
$ vi 03_Prod.in
Production
&cntrl
imin=0,
ntx=5,
irest=1,
nstlim=30000,
dt=0.002,
ntf=2,
ntc=2,
temp0=300.0,
ntpr=100,
ntwx=100,
cut=8.0,
ntb=2,
ntp=1,
ntt=3,
gamma_ln=2.0,
ig=-1,
/
una vez escrita la serie de comandos, presione la tecla Esc, luego escriba “:” y “wq”, por último oprima Enter.
“wq” le indica al vi que guarde los cambios y luego salga.
Estos settings pueden resumirse del siguiente modo:
ntx=5
irest=1
temp0=300.0
ntb=2
ntp=1
Leer coordenadas y velocidades del archivo sin formato inpcrd.
Recomenzar la dinámica molecular previa. (Esto significa que se espera que el archivo npcrd contenga
velocidades, las cuales se utilizarán para proveer velocidades iniciales a los átomos.)
Fijar temperatura del termostato a 300K.
Utilizar condiciones periódicas de contorno en condiciones de presión constante.
Utilizar el barostato de Berendsen.
Dinámica Molecular utilizando el motor Sander
Ahora que usted posee todos los ingredientes: el archivo de parámetros y topología di-ala_sol.top, el archivo de
coordenadas di-ala_sol.crd, y los archivos input 01_Min.in, 02_Heat.in, y 03_Prod.in, se encuentra listo para correr la
minimización, el calentamiento, y la producción.
La dinámica será corrida utilizando el motor Sander, de Amber. El Sander se corre desde la línea de comandos. A través
de ella, se le especificarán al programa las opciones y los archivos a utilizar.
Corra la minimización del di péptido con Sander
Biofísica: Trabajo Práctico N° 2 – Sebastián Fernández Alberti / Marcos Grosso – Página 7 de 18
$ sander -O -i 01_Min.in -o 01_Min.out -p di-ala_sol.top -c di-ala_sol.crd -r 01_Min.rst -inf 01_Min.mdinfo
Aquí encontrará un resumen de la línea de comandos anterior:
-O
-i 01_Min.in
-o 01_Min.out
-p di-ala_sol.top
-c di-ala_sol.crd
-r 01_Min.rst
-info 01_Min.mdinfo
Sobre escribir los archivos de salida, si es que existen de antemano.
Indica cual es el archivo input.
Escribir archivo de salida.
Indica cual es el archivo de parámetros y topología.
Indica cual es el archivo de coordenadas.
Escribir archivo de salida de coordenadas.
Escribir archivo de salida con información sobre el estatus de la dinámica.
Sander debería completar la minimización en una cantidad pequeña de tiempo (~ 1min), dependiendo del sistema de
computadoras donde se corra. Luego de que concluya la minimización, ejecutando el comando ls podrá ver que Sander
creó los archivos: 01_Min.out, 01_Min.rst, y 01_Min.mdinfo. El 01_Min.rst será utilizado en el calentamiento.
Utilizando el comando vi abra el archivo 01_Min.out, allí podrá encontrar los detalles de la minimización. Identifique
donde se muestra la energía (ENERGY). Observe como la energía del sistema decrece a medida que avanza la
minimización.
Recuerde, para salir oprima Esc, luego escriba “:” y “q!”, por último oprima Enter.
La “q” seguida del símbolo “!” le indica al vi que salga sin guardar los cambios.
Ahora, utilizando el archivo de coordenadas y velocidades generado en la minimización (01_Min.rst), se correrá el
calentamiento.
Corra el calentamiento del di péptido con Sander
$ sander -O -i 02_Heat.in -o 02_Heat.out -p di-ala_sol.top -c 01_Min.rst -r 02_Heat.rst -x 02_Heat.mdcrd -inf
02_Heat.mdinfo
Aquí encontrará un resumen de la línea de comandos anterior:
-c 01_Min.rst
-x 02_Heat.mdcrd
Como coordenadas iniciales utilizar las obtenidas a partir de la minimización.
Archivo de salida con la trayectoria de la dinámica molecular.
Sander debería completar el calentamiento en una cantidad pequeña de tiempo (~ 5min). En el archivo 02_Heat.out
encontrará la salida del calentamiento. Podrá ver información del sistema como la energía a cada paso, la temperatura,
etc. A modo de ejemplo (Figura 7)
Figura 7: A modo de ejemplo, sección del archivo de salida de un calentamiento.
Entre otros valores importantes cabe resaltar:
NSTEP
TIME
TEMP
PRESS
Etot
Ektot
Eptot
El paso de tiempo con el cual se corrió la dinámica.
El tiempo total de la simulación.
Temperatura del sistema.
Presión del sistema. (Nota 4)
Energía total del sistema.
Energía cinética del sistema.
Energía potencial del sistema.
Note 4: La presión es 0.0 dado que no se está utilizando ningún barostato en esta parte de la simulación.
Ahora que se ha completado la minimización y el calentamiento, se procederá a correr la producción.
Corra la producción del di péptido con Sander
Biofísica: Trabajo Práctico N° 2 – Sebastián Fernández Alberti / Marcos Grosso – Página 8 de 18
$ sander -O -i 03_Prod.in -o 03_Prod.out -p di-ala_sol.top -c 02_Heat.rst -r 03_Prod.rst -x 03_Prod.mdcrd -inf
03_Prod.mdinfo &
El símbolo “&” al final de la línea de comandos hace que Sander corra en segundo plano, dejando la línea de comandos
disponible para ser utilizada. Le tomará al programa un tiempo moderado correr la producción (~ 15min). Deje correr la
dinámica. Mientras tanto, usted podrá monitorea el avance de la dinámica mediante el archivo 03_Prod.out
$ tail -f 03_Prod.out
el comando tail imprimirá el final del archivo en cuestión.
También puede seguirse el avance de la dinámica monitoreando el archivo 03_Prod.mdinfo, el mismo provee al detalle
del desarrollo de la producción así como tiempo estimado para completar el proceso.
Una vez completada la producción, utilizando vi abra el archivo 03_Prod.out y asegúrese de que el proceso se ha
completado normalmente.
Visualización de los resultados
Usted ha corrido una simulación de dinámica molecular. A fin de visualizar los resultados se utilizará el programa
llamado VDM (Visual Molecular Dynamics). Este es un programa que permite ver moléculas en 3D. Con VDM se
pueden abrir diversos tipos de archivos, en el caso del presente TP se utilizará el VDM para observar la trayectoria de la
dinámica.
Antes de empezar con la visualización en sí, usted debe descargar los archivos generados en la dinámica a una carpeta
que se halle en la máquina donde está trabajando.
Al comienzo del presente TP usted creó una carpeta llamada tp2_nombre en la computadora donde está trabajando.
Abra una terminal nueva, entre en dicha carpeta, y ejecute el comando scp
$ scp [email protected]:/home/alumno/tp2_nombre/* .
El Cluster solicitará la contraseña para permitirle descargar los archivos, ingrese la misma clave que utilizó para acceder
a él. Es decir: biofisica
A continuación se desglosa brevemente la línea de comando anterior
scp
[email protected]
/home/alumno/tp2_nombre/
*
.
Comando secure copy.
Cluster donde accederá el scp.
Carpeta de origen.
Copiar todos los archivos.
Carpeta de destino, el “.” indica aquí por lo que se ha de estar
posicionado en la carpeta a donde se desean copiar los archivos.
Una vez descargados los archivos de la dinámica, ejecute el VDM
$ VDM
Se abrirán dos ventanas nuevas: VDM Main y VDM OpenGL Display.
Para abrir la trayectoria cree una nueva molécula mediante File → New Molecule... (Figura 8)
Se abrirá una tercer ventana de VDM llamada Molecule File Browser (Figura 9). Allí haga clic en el botón Browse... se
abrirá una nueva ventana (titulada Choose a molecule file), haga clic en Browse y de la lista seleccione el archivo de
parámetros y topología llamado di-ala_sol.top, haga clic en OK. Elija como tipo de archivo AMBER7 Parm. Haga clic
en Load.
Ahora vuelva a hacer clic sobre el botón Browse... y elija el archivo con la trayectoria de AMBER llamado
03_Prod.mdcrd. Seleccione como tipo de archivo AMBER Coordinates with Periodic Box. Por último, haga clic en
Load.
VDM cargará la trayectoria para ser visualizada. La ventana principal de VDM (VDM Main) puede ser utilizada para
controlar la reproducción de la “película” de la dinámica (Figura 8).
Biofísica: Trabajo Práctico N° 2 – Sebastián Fernández Alberti / Marcos Grosso – Página 9 de 18
Figura 8: Ventana Principal de VDM (VDM Main). El rectángulo azul indica los botones que permiten controlar la
reproducción de la trayectoria de la dinámica.
Figura 9: Ventana de VDM: Buscador de los Archivos de Moléculas.
(Molecule File Browser)
Mediante el mouse, en la ventana ventana OpenGL Display se puede rotar y hacer zoom de la molécula:
 El botón izquierdo mueve la caja de agua en todos los sentidos.
 El botón derecho gira la imagen respecto a un eje centrado en el medio de ella, y que sale hacia el observador.
Al comienzo de la visualización el eje Z coincide con dicho eje.
 En la Ventana Principal de VDM vaya a Display, y luego haga clic en Reset View. Mueva nuevamente el mouse
mientras oprime el botón derecho. Note que el eje de rotación es el eje Z.
 Mediante el botón del medio, girando la rueda, se controla el zoom.
A través de la ventana Graphics → Representations se pueden elegir muchas opciones de visualización diferentes
(Figura 10). Por ejemplo, usted puede restringir la misma solo al di péptido. En la sección llamada Selected Atoms, en la
cual figura en este momento “all”, escriba “all not water” y luego oprima Enter.
Figura 10: Ventana de VMD: Representaciones Gráficas (Graphics
Representations).
A través de ella, en Color Method se puede elegir visualizar la
molécula coloreando la misma según residuo, elemento de estructura
secundaria, factor beta, etc.
Luego, en Drawing Method se puede elegir ver la molécula
representada con líneas, en formato Cartoon o New Cartoon, en forma
de cintas (Ribbons), etc.
La caja de agua ha desaparecido (volviendo a escribir “all” será nuevamente visible), debido a la perspectiva 3D la di
alanina ha quedado alejada, haga zoom para mejorar la visualización.
En la ventana Graphics → Representations, de entre las opciones disponibles en Drawing Method, elija un modelo
más interesante, Licorice por ejemplo (o CPK).
Reproduzca la película de la dinámica (Figura 8). Si lo desea, usted puede por ejemplo disminuir la velocidad de
reproducción modificando la posición de la barra denominada speed.
Biofísica: Trabajo Práctico N° 2 – Sebastián Fernández Alberti / Marcos Grosso – Página 10 de 18
VDM posee muchas más funciones, solo por mencionar algunas: mediante VDM se puede alinear moléculas, medir el
RMSD (root mean squared deviations), guardar estructuras a partir de una trayectoria, medir parámetros físicos del
sistema, etc.
A continuación se analizarán los resultados de la dinámica...
Análisis de la Dinámica Molecular
Amber incluye un grupo de herramientas que pueden ser utilizadas para examinar y analizar la dinámica. En esta parte
del trabajo práctico usted realizará un análisis sencillo de los resultados. La primera parte la realizará a través de la línea
de comandos en la terminal.
Si aún está abierta, puede utilizar la terminal en la que lanzó el VDM. Si no, abra una terminal (Ctrl+Alt+T), y luego
entre en la carpeta donde ha descargado los archivos de la dinámica. Una vez alli, cree una nueva carpeta llamada
Analisis (se aconseja no utilizar acentos en el nombre de directorios), y luego entre en ella.
$ mkdir Analisis
$ cd Analisis
Copie dentro de la carpeta Analisis el archivo llamado “process_mdout.perl”, si aún no se le ha entregado este archivo
solicíteselo al instructor.
Mediante este script, usted podrá extraer de los archivos de salida, la información concerniente a los parámetros:
presión, volumen, temperatura, densidad, y energías (energía cinética, energía potencial, y energía total; esta última
equivale a la suma de las dos anteriores).
Procese los archivos de salida con el script process_mdout.perl
./process_mdout.perl ../02_Heat.out ../03_Prod.out (Nota 5)
Nota 5: “../” indica la carpeta anterior o “madre”.
“./” ejecuta el script subsiguiente”.
Este script generará un conjunto de archivos pero solo interesan a los efectos de este TP algunos de ellos; por lo cual, a
continuación se eliminarán mediante el comando rm (remove) algunos archivos para simplificar el trabajo posterior.
$ rm summary_*
Un último ajuste antes de graficar... La parte de la dinámica concerniente al calentamiento no produce salida para la
densidad. Es decir, el archivo llamado summary.DENSITY no posee información para la primer porción de dinámica;
por lo cual, es necesario borrar esas filas.
Edite mediante el vi el archivo summary.DENSITY
$ vi summary.DENSITY
dicho archivo debería contener las primeras 101 líneas sin parámetro densidad asignado. Manteniendo oprimida la tecla
“d” usted podrá ir eliminando las filas hasta llegar a la primer fila con valor asignado. Para salir escriba wq, y luego
oprima Enter.
Otra forma de eliminar las filas, esta vez todas de una sola vez lo cual es útil si son muchas, es la siguiente:
 Oprima Esc → Salir del modo edición.
 Oprima g, dos veces seguidas → Posicionar en el principio del archivo.
 Escriba el número 101 → Número de líneas a ser borradas.
 Oprima d, dos veces seguidas → Borrar la primer línea y las 100 subsiguientes.
 Escriba wq, y luego oprima Enter → Guardar y salir.
A continuación, utilizando el programa llamado xmgrace se confeccionaran gráficos para visualizar el comportamiento
de los parámetros temperatura, densidad, energía cinética, energía potencial, y energía total; los tres últimos serán
graficados en simultaneo.
Genere, de a uno por vez, los gráficos en cuestión utilizando el programa xmgrace
$ xmgrace summary.TEMP
$ xmgrace summary.DENSITY
$ xmgrace summary.ETOT summary.EPTOT summary.EKTOT
esto abrirá sendas ventanas nuevas con los gráficos de temperatura, densidad, y energías.
Aclaración importante:
Esta simulación debería haber sido corrida durante un período de tiempo mucha más
prolongado. Cuando el tiempo es el adecuado, la producción eventualmente converge. Sin
embargo, por cuestiones de tiempo, se ha decidido correr una dinámica corta para que los
resultados estuviesen disponibles en el corto plazo.
Biofísica: Trabajo Práctico N° 2 – Sebastián Fernández Alberti / Marcos Grosso – Página 11 de 18
Durante los primeros 20ps (picosegundos) de la simulación, se puede observar un incremento lineal de la temperatura.
Luego, durante los restantes 60ps, la temperatura fluctúa establemente alrededor de 300K.
Como se ha mencionado anteriormente, no se ha registrado datos sobre la densidad durante el calentamiento. Por esta
razón, en el gráfico de la evolución de la densidad, el eje “X” comienza en el valor 20ps.
Durante los primeros 20 picosegundos de la producción la densidad varia notablemente. Lo cual se corresponde con un
cambio en las dimensiones de la caja periódica, a medida que la densidad del sistema converge.
Desde los 20ps a los 80ps, la densidad se equilibra a aproximadamente 1g/cm3.
Por último, y como se mencionó anteriormente, se puede observar que la energía total es la suma de la energía cinética
y la energía potencial.
Análisis del RMSD mediante ptraj
El RMSD (root mean squared deviations) es una medida de cuán similar resultan las coordenadas atómicas internas de
una estructura, a una referencia dada. Eligiendo vi un átomo cualquiera, con posición “i” entre los “n” átomos que
forman la molécula en análisis. Y teniendo el átomo vi coordenadas: {vix,viy,viz} y siendo wi, con coordenadas
{wix,wiy,wiz} el átomo de la molécula de referencia cuya posición equivale a la del átomo vi, el RMSD se calcula según
la fórmula (Ecuación 2):
Ecuación 2: RMSD, Root Mean Squared Deviations
El cálculo requiere que ambas estructuras tengan la misma cantidad de átomos. En este caso, ambas estructuras poseen
n átomos.
En el presente trabajo práctico usted analizará como varían las coordenadas atómicas internas del di péptido, tomando
como referencia la estructura minimizada: 01_Min.rst
El RMSD será calculado utilizando el ptraj. Este, es uno de los programas disponibles en el paquete Amber, que
permiten analizar los resultados de una dinámica.
El ptraj es operado mediante scipts y la línea de comando.
Entre en la carpeta donde se encuentran guardados los archivos 02_Heat.mdcrd y 03_Prod.mdcrd de la dinámica.
A continuación, utilizando vi cree el script para ser utilizado con el ptraj
$ vi rmsd.ptraj
allí, incluya los comandos:
trajin 02_Heat.mdcrd
trajin 03_Prod.mdcrd
reference 01_Min.rst
center :1-3 mass origin
image origin center
strip :WAT
rms reference mass out 02_03.rms time 0.2
luego, oprima Esc, escriba wq, luego oprima Enter.
Los comandos del script anterior pueden resumirse brevemente del siguiente modo:
 trajin 02_Heat.mdcrd → Cargar la trayectoria denominada 02_Heat.mdcrd
 trajin 03_Prod.mdcrd → Cargar la trayectoria denominada 03_Prod.mdcrd
 reference 01_Min.rst → Definir la estructura 01_Min.rst como la estructura de referencia, y cargar la misma.
 center :1-3 mass origin → Centrar (ponderando por masa) los residuos 1 a 3, al origen del sistema.
 image origin center → Centrar los átomos al origen, utilizando el centro de masas de la molécula.
 strip :WAT → Borrar todas las aguas.
 rms reference mass out 02_03.rms time 0.2 → Calcular el RMSD ponderado en masa, usando la referencia dada, y
escribiendo en el archivo de salida llamado 02_03.rms. El valor 0.2, asignado a la variable time, le indica al ptraj que
entre coordenadas hay un espacio que dura 0.2ps (Nota 6)
Nota 6: ntwx fue configurado en 100, es decir Sander escribirá en la trayectoria una snapshot (foto, o fotograma) cada
100 pasos de dinámica. Esto, considerando que el tiempo que dura cada paso es 2fs (0.002ps), equivale a un intervalo
de 0.2ps entre cada snapshot.( ntwx * dt = intervalo ; 100 * 0.002 = 0.2 )
Ejecute el ptraj
Biofísica: Trabajo Práctico N° 2 – Sebastián Fernández Alberti / Marcos Grosso – Página 12 de 18
$ ptraj di-ala_sol.top rmsd.ptraj > ptraj.log
mediante el símbolo “>” se guardará la salida del ptraj en el archivo ptraj.log. Mediante el vi identifique en dicho
archivo aquellos settings que fueron especificados en el script rmsd.ptraj.
En el archivo 02_03.rms se encuentra el análisis del RMSD, visualícelo mediante el xmgrace.
Edición de la película con ptraj
Llegada esta parte del trabajo práctico, usted posee los conocimientos para solucionar el problema que observó al
reproducir la película. A saber, que el di péptido se moviese por toda la caja, y a la vez girase en diferentes direcciones.
A continuación, utilizando vi cree el script para ser utilizado con el ptraj
$ vi movie.ptraj
allí, incluya los comandos:
trajin 03_Prod.mdcrd
center :1-3 mass origin
image origin center
strip :WAT
rms first mass
trajout 03_Prod_Movie.mdcrd nobox
luego, oprima Esc, escriba wq, luego oprima Enter.
Los comandos del script anterior pueden resumirse brevemente del siguiente modo:
 trajin 03_Prod.mdcrd → Cargar la trayectoria denominada 03_Prod.mdcrd
 center :1-3 mass origin → Centrar (ponderando por masa) los residuos 1 a 3, al origen del sistema.
 image origin center → Centrar los átomos al origen, utilizando el centro de masas de la molécula.
 strip :WAT → Borar todas las aguas.
 rms first mass → Superponer (ponderando en masa) todas las estructuras respecto a la primera.
 trajout 03_Prod_Movie.mdcrd nobox → Generar archivo de salida. El nobox indica que se han eliminar las
condiciones periódicas de contorno.
Mediante las operaciones de center e image se llevará la molécula al centro de la caja. De este modo, se eliminará el
desplazamiento de la di alanina por la caja.
Luego, mediante el comando rms se superpondrán todas las moléculas tomando como referencia la primera. De este
modo, se eliminará la rotación del di péptido.
Por último, mediante el comando trajout la película se guardará en el archivo denominado 03_Prod_Movie.mdcrd.
Ejecute el ptraj
$ ptraj di-ala_sol.top movie.ptraj > ptraj.log
mediante el símbolo “>” se guardará la salida del ptraj en el archivo ptraj.log. Mediante el vi identifique en dicho
archivo aquellos settings que fueron especificados en el script movie.ptraj.
En el archivo 03_Prod_Movie.mdcrd usted posee ahora la película lista para ser visualizada. Como hizo anteriormente,
visualice la misma utilizando VMD. Tenga en cuenta que se ha eliminado el solvente y las condiciones periódicas de
contorno, por lo que el archivo de topología que se debe cargar en el VMD es el correspondiente a “vacío”. Por otro
lado, en esta oportunidad, al cargar la trayectoria con la película debe seleccionarse AMBER Coordinates (y no
AMBER Coordinates with Periodic Box como se ha hecho anteriormente).
Cambio de sistema en análisis
A partir de este punto se dejará de trabajar con la dinámica molecular del di péptido de Alanina, para pasar a analizar
diferentes aspectos de una dinámica llevada a cabo con GIP (Glutaminase Interacting Protein) unida a ligando.
En el cluster donde está trabajando, bajo la carpeta cuyo path es /home/estudiante/gip_traj/ encontrará los archivos de
trayectoria de dicha dinámica, cada archivo da cuenta de 10ns, por lo que la extensión total que se analizará será 90
nanosegundos.
Estos archivos han sido editados para eliminar los movimientos de translación y rotación de la molécula, de modo que
todos los snapshots están centrados en el mismo punto, y poseen la misma orientación.
Por último, se ha eliminado las aguas y las condiciones periódicas de contorno. Adicionalmente, en la misma carpeta, se
le provee el archivo de parámetros y topología en vacío.
Medida de vida media de Puentes de Hidrógeno
Los puentes de hidrógeno presentan un carácter dinámico, en tal sentido, los mismos se forman o rompen dependiendo
de las condiciones de los átomos que lo componen y las condiciones del sistema. Se requiere una geometría dada para
que se produzca un puente de hidrógeno, es necesaria una distancia y un ángulo particular. Ambos son aspectos
dinámicos que varían a lo largo de la simulación.
Biofísica: Trabajo Práctico N° 2 – Sebastián Fernández Alberti / Marcos Grosso – Página 13 de 18
Debido al carácter transitorio de los puentes de hidrógeno, se estudia los mismos teniendo en cuenta la fracción de
tiempo en la cual se encuentra formado el enlace, respecto al total de tiempo de simulación. A este valor, propio de cada
puente de hidrógeno en particular, se lo denomina “vida media”.
A continuación, utilizando ptraj, usted calculará la vida media de un conjunto de puentes de hidrógeno. Para ello, en el
directorio denominado tp2_nombre cree una carpeta denominada pdH
$ mkdir pdH
$ cd pdH
Una vez creada la carpeta y habiendo entrado en ella, utilizando vi, genere el siguiente script:
$ vi pdh.ptraj
active la escritura oprimiendo la tecla “i” y copie los comandos:
trajin /home/estudiante/gip_traj/gip1.mdcrd
trajin /home/estudiante/gip_traj/gip2.mdcrd
trajin /home/estudiante/gip_traj/gip3.mdcrd
trajin /home/estudiante/gip_traj/gip4.mdcrd
trajin /home/estudiante/gip_traj/gip5.mdcrd
trajin /home/estudiante/gip_traj/gip6.mdcrd
trajin /home/estudiante/gip_traj/gip7.mdcrd
trajin /home/estudiante/gip_traj/gip8.mdcrd
trajin /home/estudiante/gip_traj/gip9.mdcrd
donor mask :56@OH
acceptor mask :43@OE1 :56@HH
acceptor mask :43@O :56@HH
hbond distance 3.5 angle 150.0 series
go
luego, oprima Esc, escriba wq, luego oprima Enter.
Los comandos del script anterior pueden resumirse brevemente del siguiente modo:
 donor mask → Indica que átomo actúa como donador.
 acceptor mask → Indica que átomo actúa como aceptor.
 hbond distance 3.5 angle 150.0 series pdh_gip.dat → El ptraj calculará las vidas medias de los puentes de
hidrógeno cuya distancia (entre donador y aceptor) sea de 3.5Angstroms, y cuyo ángulo entre los tres átomos
que intervienen en el enlace sea de 150°.
El comando series le indica al ptraj que escriba la salida con el porcentaje de ocupación de los puentes de hidrógeno.
Ahora, mediante el ptraj calcule las vidas medias de los puentes de hidrógeno:
$ ptraj ../gip_traj/gip_vacio.top pdh.ptraj > pdh.log
Se generará un archivo de salida llamado pdh.log. Utilizando vi visualice el mismo:
$ vi pdh.log
Al final de dicho archivo encontrará una tabla del tipo (Figura 11):
Figura 11: Porcentaje de ocupación de puentes de hidrógeno.
La séptima columna de la tabla muestra el porcentaje de ocupación para los dos puentes de hidrógeno en análisis.
En el primer caso, la ocupación es del 83%. Es decir, el 83% del tiempo de la dinámica se puede encontrar un puente de
hidrógeno entre el grupo oxidrilo de la Tirosina y el oxígeno del backbone de la Glutamina.
En el segundo, donde se analiza si podría encontrarse un enlace entre el grupo oxidrilo de la Tirosina y el oxígeno del
grupo amida de la Glutamina, el porcentaje de ocupación es prácticamente nulo, es decir en realidad no se forma ningún
enlace de hidrógeno.
Medida del RMSF y de Factores Beta
Mediante la determinación del RMSF (Root Mean Square Fluctuation) se obtiene una medida de cuanto se aleja una
partícula “i” de una posición de referencia dada (Ecuación 3).
Ecuación 3: Root Mean Square Fluctuation
Biofísica: Trabajo Práctico N° 2 – Sebastián Fernández Alberti / Marcos Grosso – Página 14 de 18
donde T es el tiempo total sobre el que se calculará el promedio, y xi sombrero es la posición de referencia para la
partícula i. Normalmente, se toma como posición de referencia a la posición promedio de la partícula i en el tiempo.
Mediante el ptraj se puede calcular el RMSF discriminado por átomo, por residuo, o para una selección particular
definida por una máscara determinada por el usuario.
Así también, se le puede indicar al ptraj que lo que se desea calcular son los factores beta, para lo cuál el programa
2
.
Entre en la carpeta denominada tp2_nombre
$ cd tp2_nombre
una vez allí, utilizando vi genere el siguiente input para ptraj
$ vi rmsf.ptraj
active la escritura oprimiendo la tecla “i” y copie los comandos:
trajin /home/estudiante/gip_traj/gip1.mdcrd
trajin /home/estudiante/gip_traj/gip2.mdcrd
trajin /home/estudiante/gip_traj/gip3.mdcrd
trajin /home/estudiante/gip_traj/gip4.mdcrd
trajin /home/estudiante/gip_traj/gip5.mdcrd
trajin /home/estudiante/gip_traj/gip6.mdcrd
trajin /home/estudiante/gip_traj/gip7.mdcrd
trajin /home/estudiante/gip_traj/gip8.mdcrd
trajin /home/estudiante/gip_traj/gip9.mdcrd
strip :125-132
atomicfluct byres out gip.rmsf
luego, oprima Esc, escriba wq, luego oprima Enter.
Los comandos del script anterior pueden resumirse brevemente del siguiente modo:
 strip :125-132 → Borrar residuos 125 a 132, correspondientes al ligando de GIP.
 atomicfluct byres out gip.rmsf → Calcular RMSF por residuo. Guardar resultados en archivo de salida
gip.rmsf
Ahora, mediante el ptraj calcule el RMSF:
$ ptraj ../gip_traj/gip_vacio.top rmsf.ptraj > rmsf.log
En el archivo llamado rmsf.log se encuentra un detalle de las operaciones llevadas a cabo por el ptraj. Como ha hecho
anteriormente, visualice dicho archivo mediante vi.
En la máquina donde está trabajando, entre en la carpeta tp2. Ahora, usted descargará el archivo gip.rmsf y lo guardará
en dicha carpeta
$ scp [email protected]:/home/estudiante/tp2_nombre/gip.rmsf .
Recuerde, la clave es: biofisica (en minúsculas y sin acento)
Nota, no olvide el “.” al final del comando, lo cual le indica al scp que el archivo debe ser guardado en la carpeta donde
se ejecuta el comando.
Utilizando xmgrace genere un gráfico con los resultados del RMSF
$ xmgrace gip.rmsf
A continuación, utilizando vi genere el siguiente input para ptraj
$ vi bfactor.ptraj
active la escritura oprimiendo la tecla “i” y copie los comandos:
trajin /home/estudiante/gip_traj/gip1.mdcrd
trajin /home/estudiante/gip_traj/gip2.mdcrd
trajin /home/estudiante/gip_traj/gip3.mdcrd
trajin /home/estudiante/gip_traj/gip4.mdcrd
trajin /home/estudiante/gip_traj/gip5.mdcrd
trajin /home/estudiante/gip_traj/gip6.mdcrd
trajin /home/estudiante/gip_traj/gip7.mdcrd
trajin /home/estudiante/gip_traj/gip8.mdcrd
trajin /home/estudiante/gip_traj/gip9.mdcrd
strip :125-132
atomicfluct byatom out gip.bfactor bfactor
luego, oprima Esc, escriba wq, luego oprima Enter.
Los comandos del script anterior pueden resumirse brevemente del siguiente modo:
 atomicfluct byatom out gip.bfactor bfactor → Calcular los factores beta por átomo. Guardar resultados en
archivo de salida gip.bfactor
Ahora, mediante el ptraj calcule los factores beta:
$ ptraj ../gip_traj/gip_vacio.top bfactor.ptraj > bfactor.log
En el archivo llamado bfactor.log se encuentra un detalle de las operaciones llevadas a cabo por el ptraj. Como ha
Biofísica: Trabajo Práctico N° 2 – Sebastián Fernández Alberti / Marcos Grosso – Página 15 de 18
hecho anteriormente, visualice dicho archivo mediante vi.
En la máquina donde está trabajando, entre en la carpeta tp2. Ahora, usted descargará el archivo gip.bfactor y lo
guardará en dicha carpeta
$ scp [email protected]:/home/estudiante/tp2_nombre/gip.bfactor .
Nota, no olvide el “.” al final del comando, lo cual le indica al scp que el archivo debe ser guardado en la carpeta donde
se ejecuta el comando.
Utilizando xmgrace genere un gráfico con los resultados de los factores beta
$ xmgrace gip.bfactor
Mapa de Correlaciones
El concepto de relación en estadística coincide con lo que se entiende por relación en el lenguaje habitual: dos variables
están relacionadas si varían conjuntamente.
Si los sujetos de una población tienen valores, altos o bajos, simultáneamente en dos variables, tenemos una relación
positiva. Por ejemplo peso y altura en una muestra de niños de 5 a 12 años: los mayores en edad son también los más
altos y pesan más, y los más jóvenes son los que pesan menos y son más bajos de estatura; decimos que peso y altura
son dos variables que están relacionadas porque los más altos pesan más y los más bajos pesan menos.
Si los valores altos en una variable coinciden con valores bajos en otra variable, tenemos una relación negativa; por
ejemplo edad y fuerza física en una muestra de adultos de 30 a 80 años de edad: los mayores en edad son los menores
en fuerza física; hay una relación, que puede ser muy grande, pero negativa: según los sujetos aumentan en una variable
(edad) disminuyen en la otra (fuerza física).
En proteínas, los pares de residuos pertenecientes a un mismo dominio estructural por lo regular presentan correlación
positiva. Esto es, fluctúan en la misma dirección. Mientras que los residuos pertenecientes a dominios diferentes suelen
fluctuar en direcciones opuestas. Es decir, están anticorrelacionados.
A partir de la trayectoria de una simulación de dinámica molecular es posible obtener información sobre las
correlaciones entre residuos, o carbonos alfa, o cualquier otra selección de átomos. Las correlaciones entre los
movimientos de cualquier par i y j viene dada por (Ecuación 4)
Ecuación 4: Correlación entre el par i y j
Siendo Δxi el desplazamiento de la coordenada xi, respecto a una referencia dada (usualmente el valor medio para esa
posición) en el tiempo tm. Los paréntesis angulares refieren al promedio sobre el tiempo (que en la práctica, para
dinámica molecular, es el número m de snapshots o fotogramas que forman la trayectoria).
Lo mismo aplica para j.
De este modo, se obtendrá una matriz simétrica cuadrada de dimensión NxN, con elementos C(i,j). Siendo N el número
de pares a los cuales se les calculará la correlación.
En el caso de dinámica molecular, N será el número de residuos, o carbonos alfa, o cualquier otra selección de átomos
que se haya hecho.
A continuación, utilizando ptraj usted calculará la correlación entre los 101 carbonos alfa que forman GIP, una vez
eliminados los extremos N y C terminales.
Entre en la carpeta denominada tp2_nombre
$ cd tp2_nombre
una vez allí, utilizando vi genere el siguiente input para ptraj
$ vi correl.ptraj
active la escritura oprimiendo la tecla “i” y copie los comandos:
trajin /home/estudiante/gip_traj/gip1.mdcrd
trajin /home/estudiante/gip_traj/gip2.mdcrd
trajin /home/estudiante/gip_traj/gip3.mdcrd
trajin /home/estudiante/gip_traj/gip4.mdcrd
trajin /home/estudiante/gip_traj/gip5.mdcrd
trajin /home/estudiante/gip_traj/gip6.mdcrd
trajin /home/estudiante/gip_traj/gip7.mdcrd
trajin /home/estudiante/gip_traj/gip8.mdcrd
trajin /home/estudiante/gip_traj/gip9.mdcrd
strip :125-132
strip :113-124
strip :1-11
strip !@CA
matrix correl out gip.correl byres
Biofísica: Trabajo Práctico N° 2 – Sebastián Fernández Alberti / Marcos Grosso – Página 16 de 18
luego, oprima Esc, escriba wq, luego oprima Enter.
Los comandos del script anterior pueden resumirse brevemente del siguiente modo:
 trajin /home/estudiante/gip_traj/gip1.mdcrd → Como para todos los casos anteriores, al igual que para el resto
de los archivos hasta el de índice 9. Cargar archivos de trayectorias. Incluye la ruta al archivo a ser cargado,
esto es necesario dado que las trayectorias no están en el directorio donde se lanza el ptraj. (Nota 7)
 strip :125-132 → Borrar residuos 125 a 132, ligando de GIP.
 strip :113-124 → Borrar residuos 113 a 124, correspondientes al extremo C terminal de GIP.
 strip :1-11 → Borrar residuos 1 a 11, correspondientes al extremo N terminal de GIP.
 strip !@CA → Borrar todo excepto los carbonos alfa. GIP está compuesta por 124 residuos, luego 124 – 11 –
12 = 101.
 matrix correl out gip.correl byres → Calcular la correlación de forma matricial. Dimensiones de la matriz:
101x101. Igual al número de carbonos alfa. Escribir salida en archivo gip.correl. (Nota 8)
Nota 7: La práctica indica que es una “sana costumbre” poner el path completo. Por ejemplo:
/home/estudiante/gip_traj/ para el archivo gip1.mdcrd. Y no sólo el nombre del archivo, si es que el mismo
está en la carpeta donde se ejecuta el programa que lo leerá; o bien, “../” si está un directorio atrás. Poner el path
completo hace que el archivo pueda ser leído desde cualquier lugar, dentro del sistema de directorios de la computadora.
Nota 8: Dado que se han eliminado todos los átomos, excepto los que se deseaban utilizar en el cálculo de
correlaciones, no tiene sentido el setting byres. No obstante esto, y dado que no debería tener ningún efecto sobre el
resultado del TP, el setting byres se incluyó como ejemplo de opción de máscara. Otro ejemplos de opciones de
máscar es: byatom, esta sirve para calcular la correlación para todos los átomos del sistema. Así también, la máscara
cuya sintaxis es: @C,CA,N byres, sirve para seleccionar el backbone.
Cuando se realiza un strip de átomos con el ptraj es importante empezar de abajo hacia arriba. Note como
primero se remueven las aguas, luego el ligando, a continuación el extremo C terminal, y por último el
extremo N terminal. Ese, es el orden correcto. El ptraj realiza una operación de strip por vez, y luego de
realizarla reasigna los índices (numeración de los átomos). Por esta razón, si se eliminaran primero los
átomos del extremo N terminal, habría luego que recalcular los índices. A modo de ejemplo, si se
eliminasen los 11 residuos del extremo N terminal primero, el residuo número 12 pasaría a ser el número
1.
Ahora, mediante el ptraj calcule la correlación:
$ ptraj ../gip_traj/gip_vacio.top correl.ptraj > correl.log
En el archivo llamado correl.log se encuentra un detalle de las operaciones llevadas a cabo por el ptraj. Como ha hecho
anteriormente, visualice dicho archivo mediante vi.
En la máquina donde está trabajando, entre en la carpeta tp2. Ahora, usted descargará el archivo gip.correl y lo
guardará en dicha carpeta
$ scp [email protected]:/home/estudiante/tp2_nombre/gip.correl .
Nota, no olvide el “.” al final del comando, lo cual le indica al scp que el archivo debe ser guardado en la carpeta donde
se ejecuta el comando.
Si aún no lo ha hecho, y lo desea, utilizando vi usted puede abrir el archivo gip.correl y corroborar que la matriz de
correlaciones que calculó sea cuadrada y simétrica. Se recomienda el ejercicio. De hacerlo, una vez dentro del archivo
escriba “:” y luego “set nowrap”, luego oprima Enter. De este modo, podrá visualizar correctamente la matriz.
gnuplot - Mapa de correlaciones
A continuación, los resultados del análisis de correlación serán visualizados mediante un gráfico de tipo “mapa de
calor”, o más comúnmente llamado por su sigla en ingles, “heat map”. Para realizar este gráfico usted utilizará el
programa llamado gnuplot, éste funciona mediante la linea de comando.
En la carpeta donde ha descargado el archivo gip.correl que contiene la matriz de correlación, ejecute el gnuplot
$ gnuplot
El promtp ahora es “gnuplot>”
luego ejecute el siguiente grupo de comandos:
gnuplot> set pm3d map
gnuplot> splot "gip.correl" matrix
se debería haber abierto una ventana con el gráfico tipo heat map..
A continuación encontrará un grupo de comandos que le permiten editar el gráfico de correlaciones:
gnuplot> set title "Correlacion de 101 C alfa de GIP”
gnuplot> unset key
gnuplot> set cblabel "Negativa ← Correlación → Positiva"
Biofísica: Trabajo Práctico N° 2 – Sebastián Fernández Alberti / Marcos Grosso – Página 17 de 18
gnuplot> unset cbtics
gnuplot> set xlabel "numero de Calfa"
gnuplot> set ylabel "numero de Calfa"
gnuplot> replot
Ahora, guarde el gráfico de correlaciones que acaba de generar, para ello ejecute el comando:
gnuplot> set terminales
elija una de la lista que la terminal le devuelve, de preferencia jpeg o alguna otra genérica, y ejecútela
gnuplot> set output "gip_correl.jpeg"
La sesión de gnuplot puede ser salvada mediante el comando:
gnuplot> save "gip_correl.gp"
Por último, cierre el gnuplot mediante el comando quit
gnuplot> quit
Biofísica: Trabajo Práctico N° 2 – Sebastián Fernández Alberti / Marcos Grosso – Página 18 de 18
Descargar